버추얼 스트리머, 이커머스 라이브에서 자리 잡을 수 있을까?
2016년, 라이브 커머스 열풍이 거세게 불어 닥치며 업계는 광속 성장했습니다. 2021년 말, 신바 논란, 웨이야 탈세 사건, 리자치 장기 중단, 뤄융하오의 점진적 은퇴 등 일련의 사건이 이어지며 라이브 커머스 트랙은 점차 냉각되었고, 정식으로 ‘후반전’에 진입했습니다.
동시에 메타버스 개념이 폭발적으로 주목받으면서 버추얼 디지털 휴먼 트랙이 뜨거워졌습니다. Web3식 메타버스 세계가 아직 완전히 도래하지는 않았지만, 버추얼 휴먼은 이미 대중의 시야 속으로 들어왔습니다. 송년 특집 방송부터 브랜드 광고, 실시간 방송 보조부터 라이브 판매까지, 곳곳에서 이들의 모습을 볼 수 있습니다.
2022년 더블 11 기간, 징둥(JD)은 모파테크의 소비자용 버추얼 라이브 제품 ‘유광’을 도입했습니다. 버추얼 스트리머는 7회의 라이브에 참여해 총 1,380분을 방송했고, 500개가 넘는 상품을 소개하며 약 300만 위안에 달하는 GMV를 기록했습니다. 자정 무렵, 많은 브랜드 라이브룸에서도 디지털 휴먼을 볼 수 있습니다. 그렇다면 버추얼 스트리머는 과연 인간 진행자를 대체할 수 있을까요? 이 글에서는 라이브 커머스 환경에서 MCN 기관과 브랜드가 겪는 문제, ‘중의인(中之人)’ 기반과 AI 기반 버추얼 스트리머의 가치와 한계, 그리고 향후 지능형 라이브룸의 ‘사람-상품-장소’에 대해 살펴봅니다.
라이브 커머스, 후반전에 진입하다
2022년 제50차 중국 인터넷 발전 통계 보고서에 따르면, 이커머스 라이브 이용자 수는 4억 6,900만 명으로, 2021년 12월 대비 533만 명 증가했으며 전체 네티즌의 44.6%를 차지합니다. 왕징서(网经社)의 데이터에 따르면, 2021년 라이브 커머스 거래 규모는 2조 3,615.1억 위안, 침투율은 17.97%에 달했습니다. 업계가 여러 우여곡절을 겪었음에도 라이브 커머스의 열기는 여전히 식지 않았습니다.
현재 라이브 커머스는 점차 성숙기와 규범화 단계로 나아가고 있습니다. 상품 카테고리는 초기의 뷰티, 의류, 식품·음료에서 가구, 유아용품, 스포츠·아웃도어 등 여러 분야로 확장되었습니다. 라이브 운영 방식도 단순 할인 중심에서 지식 전달, 구호형 멘트, 연기·극화 콘텐츠 등 다채로운 콘텐츠 기반 유입 방식으로 진화했습니다. 플랫폼의 라이브 상점에 대한 규제가 강화되면서, 플랫폼 경쟁은 종합 운영 역량을 더욱 중시하는 방향으로 이동하고 있습니다.
MCN 기관, 인재 관리의 어려움
2021년 기준 중국의 MCN 기관 수는 2만 개를 넘었고, 성장세는 둔화되었으며 전체 트래픽도 정점을 찍었습니다. 치열한 시장 경쟁 속에서 MCN은 멀티 플랫폼·멀티 계정 전략을 통해 트래픽과 유저 풀을 쟁탈합니다. 예를 들어 ‘친구를 사귀자(交个朋友)’는 뤄융하오의 영향력을 활용해 더우인(Douyin)에서 사용자 풀을 확장했고, 17개의 매트릭스 계정을 운영해 소비자가 필요에 따라 다른 라이브룸을 선택해 쇼핑할 수 있게 했습니다.
인재 관리는 MCN 기관의 핵심 난제입니다. 한편으로는 인력 채용이 어렵고 인건비가 상승하고 있으며, 다른 한편으로는 진행자가 인기를 얻은 뒤 이탈할 수 있어 기관이 트래픽을 잃을 위험이 있습니다. 진행자를 붙잡기 위해 기관은 처우를 높일 수밖에 없습니다. 슈퍼 진행자 관리 난이도는 더욱 큽니다. 웨이야 탈세 사건, 리쯔치와 기관의 갈등 등은 업계 전체에 경종을 울렸습니다. 슈퍼 진행자가 이탈하거나 부정 이슈가 발생하면 기관의 손실은 막대합니다. 그래서 플랫폼과 MCN은 끊임없이 인플루언서 매트릭스를 확장하고, 다각화된 비즈니스를 전개해 소수의 트래픽 스타에 대한 의존도를 낮추려 합니다.
이커머스 진행자, 극한의 경쟁
라이브 커머스가 떠오른 이유는 소비자에게 ‘좋음’과 ‘저렴함’이라는 두 가지 차별화된 가치를 제공했기 때문입니다. 라이브룸에서 소비자는 상품의 외관과 기능을 직관적으로 확인할 수 있고, 진행자는 발색 테스트나 피팅 서비스 등을 제공합니다. 또한 실시간으로 진행자와 상호작용하며 더 많은 상품 정보를 얻을 수 있는데, 이것이 바로 ‘정보 가치’입니다. 장기적인 상호작용은 진행자와 시청자 사이에 감정적 연결을 만들어내며, 이 신뢰와 감정적 유대가 바로 ‘신용 가치’, 즉 ‘좋음’의 핵심입니다. ‘저렴함’은 수요 집적으로부터 오며, 규모의 경제를 제대로 활용해 지속적으로 좋은 가격을 제공할 수 있는 것은 결국 톱 진행자뿐입니다.
이러한 가치를 실현하려면 진행자는 표현력, 상호작용 능력, 스트레스 대처 능력을 갖추어야 합니다. 표현력은 제품 가치를 생동감 있게 전달하고, 전문 지식과 개인 매력을 겸비하는 것을 의미합니다. 상호작용 능력은 진행자가 시청자와 효과적으로 소통하며 질문에 답하고 구매 신뢰를 높이는 능력입니다. 스트레스 대처 능력은 고압 환경에서도 좋은 상태를 유지하며, 부정적인 감정을 라이브룸으로 가져오지 않는 능력을 말합니다.
《2021-2022 중국 MCN 산업 발전 연구 보고서》에 따르면, 2022년 중국 라이브 커머스 진행자 수는 123.4만 명에 이를 것으로 예상되었습니다. 전업 진행자 외에도 연예인, 버티컬 KOL 등이 잇달아 라이브 판매 대열에 합류했습니다. 톱 진행자의 마태 효과는 이미 뚜렷합니다. ‘친구를 사귀자’는 ‘7x24시간 라이브’ 모델을 실행하고, 둥팡전쉬안(동방선택)은 하루 평균 17.5시간의 라이브를 안정적으로 이어가고 있습니다. 례오랴(로레알), 화시쯔, 리닝 등 브랜드는 심야 시간대에 버추얼 스트리머를 사용해 24시간 끊김 없는 라이브를 구현하고 있습니다. 그렇다면 버추얼 스트리머의 실제 성과는 어떨까요?
버추얼 스트리머, 인간을 대체할 수 있을까
현재 버추얼 디지털 휴먼은 기술 구동 방식에 따라 ‘중의인(中之人)’ 기반과 AI 기반 두 가지로 나뉩니다.
‘중의인’은 버추얼 스트리머의 라이브를 실제로 조종하는 사람을 의미하며, 모션 캡처와 페이셜 캡처 기술을 통해 버추얼 캐릭터와 현실의 상호작용을 구현합니다. 풀바디 모션 캡처 장비 한 세트는 약 2만 9천 위안, 소프트웨어 연간 서비스 비용은 800위안 정도이며, 페이셜 캡처 장비는 약 6천 위안입니다. 중의인은 버추얼 캐릭터의 ‘영혼’이고, 버추얼 외형은 단지 ‘껍데기’에 불과합니다. AI 기반 구동은 AI 기술을 통해 버추얼 휴먼을 생성·구동·콘텐츠 생성까지 담당하게 하여, 감지와 표현 등 상호작용 능력을 갖추게 합니다. 외부 입력 정보를 지능적으로 읽고 분석해, 이에 대응하는 음성과 동작을 생성해 유저와 상호작용할 수 있습니다.
중의인 기반, 라이브는 잘하지만 판매는 별개
중의인 기반 버추얼 스트리머는 참신한 콘텐츠 형식으로 시청자를 끌어들이며 MCN이 선호하는 포맷이 되었고, 라이브 시장에서 더 많은 트래픽을 확보할 수 있습니다. 하지만 버추얼 스트리머는 인간 진행자처럼 실시간으로 상품을 테스트할 수 없기 때문에, 보통 실제 보조 진행자가 메이크업 발색, 의류 착용 감 등 상품의 강점을 시연해 주어야 합니다.
웨이야 ‘추락’ 이후, 중의인 기반 버추얼 스트리머도 비슷한 문제에 직면할 수 있다는 우려가 제기되었습니다. 일본 버추얼 아이돌 키즈나 아이(Kizuna AI)는 중의인 교체로 인해 인기가 떨어졌고, 버추얼 아이돌 그룹 A-Sou는 중의인에 대한 처우 문제가 불거져 팬들의 반발을 샀습니다. 이 사례들은 팬들이 버추얼 아이돌의 ‘껍데기’보다 ‘영혼’을 더 중시한다는 것을 보여 줍니다. 이는 버추얼 아이돌이 저비용·저위험 비즈니스일 것이라는 가정에 도전장을 던지며, 중의인의 윤리와 직업 의식이 똑같이 중요하다는 점을 시사합니다.
이커머스 진행자는 아이돌 속성을 어느 정도 가지고 있습니다. 리자치는 ‘모든 여성’의 사랑을 받는데, 팬들이 그를 진실되고 긍정 에너지를 전하는 인물로 느끼기 때문입니다. 진행자와 팬 사이의 신뢰와 감정적 연결은 결국 실제 인간에게서 비롯됩니다. 따라서 MCN이 중의인 기반 버추얼 이커머스 진행자를 운영하는 것은 전혀 리스크가 없는 선택이 아닙니다.
AI 기반, 아직은 미성숙 단계
로레알, YSL, 랑콤 등 브랜드는 AI 기반 버추얼 스트리머를 활용해 자체 라이브를 진행하지만, 기술 수준이 아직 인간 진행자에 미치지 못해 보통 심야 시간대에만 편성됩니다. 알리바바 클라우드의 브랜드 지능형 라이브룸 기본 버전은 연간 채널당 9만 9천 위안에 판매되며, 라이브 스크립트 지능 생성, 멀티모달 지능 상호작용, 마케팅 플랫폼 지능 통합 등의 기능을 제공합니다.
타오바오 지능형 라이브룸의 버추얼 캐릭터는 대부분 3D 카툰 스타일로, 풍부한 동작 라이브러리와 자연스러운 합성 음성을 갖추어 생동감 있는 판매 스타일을 보여 줍니다. 브랜드는 버추얼 진행자의 의상을 커스터마이징할 수 있으며, 예를 들어 더 노스페이스 공식 스토어의 버추얼 진행자는 자사 제품을 착용합니다. 상품 전시는 이미지 위주로 진행되며, 진행자가 핵심 셀링 포인트를 설명할 때 화면에는 텍스트 효과가 나타납니다. 라이브룸 배경은 3차원 공간감을 살려 상호작용형 버추얼 무대를 연출하고, 상품을 소개할 때는 블루스크린을 활용해 상품 이미지를 합성합니다. 라이브 인터랙션 플로우는 입장 인사, 팔로우 및 주문 유도 멘트, Q&A 등 비교적 고정된 구조를 취합니다.
로레알 징둥 자영 플래그십 스토어는 2D 반실사형 버추얼 캐릭터를 사용하며, 2분 분량의 영상만 녹화하면 트레이닝을 통해 커스터마이징을 마칠 수 있습니다. 상품 전시는 인간 진행자 라이브를 참고해, 버추얼 인물 앞에 상품 이미지를 나열하는 방식입니다. 하지만 버추얼 진행자는 실제로 상품을 만지고 사용할 수 없기 때문에, 리뷰의 진정성이 떨어지고 유저의 반감을 사기 쉽습니다. 현재 AI 기반 버추얼 스트리머는 아직 ‘꽃병’에 가까워, 호기심 유저를 끌어들이고 기본적인 상품 소개와 간단한 질의응답 정도만 담당하고 있습니다.
지능형 라이브룸의 ‘사람-상품-장소’
버추얼 이미지, 예쁜 껍데기와 재미있는 영혼
버추얼 디지털 휴먼의 외형 스타일은 2D에서 3D까지, 카툰부터 초실감형까지 매우 다양합니다. 정밀도가 높을수록 제작 비용도 비싸집니다. 2022년 기준 초실감형 버추얼 휴먼 영상 제작 단가는 초당 8,000~15,000위안 수준이었고, 리우예시(柳夜熙)의 4분짜리 영상 제작비는 100만 위안을 넘었습니다. 다만 모델링 기술이 발전함에 따라 제작 문턱과 비용, 기간은 점차 낮아질 전망입니다.
리우예시, AYAYI 같은 초실감 버추얼 인물이 큰 관심을 받는 반면, ‘옆집 소녀’ 콘셉트의 버추얼 인플루언서 아시 Angie는 힐링 감성으로 팬을 모읍니다. ‘예쁜 외모는 비슷비슷하지만, 재미있는 영혼은 천에 하나’라는 말처럼, 버추얼 휴먼의 기능은 복제할 수 있지만 돋보이려면 독특한 포지셔닝, 양질의 콘텐츠, 장기적인 운영이 필요합니다. AIGC 기술이 콘텐츠 제작 비용을 낮추더라도, 뛰어난 콘텐츠는 여전히 인간의 상상력에 의존합니다.
라이브의 가장 큰 가치는 상호작용성에 있습니다. 인터랙션이 강화될수록 시청자의 현장감이 높아지고 구매 결정에 미치는 영향도 커집니다. 댓글 창은 진행자와 시청자가 소통하는 핵심 매개체이므로, 버추얼 휴먼의 댓글 분석 능력을 끌어올리는 것이 중요합니다. 버추얼 휴먼은 댓글의 유효성과 중요도, 유저 감정, 라이브룸 분위기 등을 분석해 적절한 응답을 생성해야 합니다. ChatGPT 같은 대규모 언어 모델과 지식 그래프를 결합하면, AI 기반 버추얼 스트리머의 의사결정은 더욱 지능화되고, 더 풍부하고 깊이 있는 답변을 생성해 유저 인터랙션 경험을 개선하고 시청자의 체류 시간을 늘릴 수 있습니다.
상품 전시, 진정성을 향해
라이브룸의 핵심은 진정성입니다. 상품 전시, 사용 테스트, 리뷰 등 모든 면에서 진짜처럼 느껴져야 하지만, 이는 버추얼 스트리머에게 가장 큰 도전 과제입니다. 버추얼 인플루언서 ‘링(Ling)’의 뷰티 라이브 ‘폭망’ 사례는 피부 고민이 전혀 없는 버추얼 인물이 소비자의 공감을 얻기 어렵다는 점을 보여줍니다. SLAM 등 3D 인터랙션 기술이 디지털 휴먼과 현실 공간의 상호작용을 개선할 수는 있지만, 실제 상품과의 자연스러운 상호작용을 구현하기는 여전히 어렵고, 유저는 더 많은 상품 디테일을 알고 싶어 합니다.
《2022 버추얼 디지털 휴먼 종합 평가 지수 보고서》에 따르면, 버추얼 디지털 휴먼의 발전은 세 단계로 나눌 수 있습니다. 첫째, ‘의인화 단계’로, 동작·형태·음성이 인간과 비슷해지고, AI를 기반으로 실시간 정보 교류가 부분적으로 가능해지는 단계입니다. 둘째, ‘동인화 단계’로, 외형 모사에서 감정 상호작용으로 나아가 고품질의 감정 교류를 실현하는 단계입니다. 셋째, ‘초인화 단계’로, 버추얼 휴먼의 능력이 자연인(自然人)을 넘어 ‘버추얼’이 실체화되는 수준에 도달합니다. 어쩌면 10여 년 뒤, 버추얼 스트리머가 실제 신체에 가까운 형태를 갖추었을 때 비로소 라이브 커머스 현장에서 진정한 입지를 다질 수 있을지도 모릅니다.
변하는 무대, 무한한 가능성
라이브 장면은 ‘사람’과 ‘상품’만큼 핵심적이지는 않지만, 뛰어난 비주얼 효과는 시청자가 머무르는 시간을 늘리는 데 큰 역할을 합니다. 그린스크린 기반 버추얼 라이브룸 솔루션은 비교적 비용이 낮으며, 크로마키 기술을 활용해 빠르게 버추얼 배경을 만들 수 있습니다. 휴대폰용 그린스크린 영상 합성 앱의 영구 회원권도 288위안 정도면 구매할 수 있습니다. 다만 버추얼 라이브룸 세트 구축 비용은 규모와 복잡도에 따라 크게 달라지며, 더 크고 복잡한 세트에는 더 높은 투자가 필요합니다. 앞으로 MR 장비 보급이 가속화되면 관련 기술도 빠르게 업그레이드될 것이고, 사용자는 장면·진행자·다른 시청자와 함께 상호작용하며 몰입감 있는 쇼핑 경험을 누릴 수 있을 것입니다.
