Intro
바야흐로 AI의 시대다. 22년 말 chat gpt의 등장과 함께 시작된 AI 열풍은 식을 줄을 모른다. AI는 매우 빠르게 많은 산업들을 재정의 하고 있으며, 실제 B2B에서는 활용 및 성공 사례가 종종 보도되고 있다. 이는 마치 초기 PC 시장을 보는 것 같다. 컴퓨터는 원래 대기업이나 정부만이 사용할 수 있었던 값비싼 기기였다. 하지만 반도체의 발명이 PC를 탄생시키며 작은 기업, 나아가 대중에게까지 컴퓨터가 보급될 수 있었다. 전개 과정을 살펴보면, B2B로 먼저 전파되고 일반 소비자에게(B2C)에게 전파되는 양상이다.
AI도 원래 대기업만이 사용할 수 있었던 특권이었다. 하지만 LLM은 AI를 누구나 쉽게 쓸 수 있는 세상을 만들었고, PC 시대와 마찬가지로 현재 B2B에서부터 그 변화가 시작되고 있다. AI가 B2B로 주고 있는 영향의 크기와는 반대로, 대중들은 아직 AI 서비스의 빛을 보지 못했다. OpenAI, Midjourney, Perplexity 정도를 제외하고는 대중 대상으로 뚜렷한 성과를 낸 기업이 없고, 그마저도 기존 카테고리 리더와 비교하면 아주 작은 수준이다. 여전히 대중들이 사용하는 시간과 돈은 틱톡, 인스타그램, 로블록스, 디스코드와 같은 기존 기업들에 대부분 유입되고 있다. 기존 기업들이 그들의 서비스에 체류하는 시간을 GPU 추론을 통한 알고리즘으로 증가시키는 그림은 자연스럽지만, AI로 인해 시작된 새로운 B2C 기업은 흔하지 않다. 실리콘밸리 VC 업계에서 Consumer라는 단어를 꺼내면, 아마 투자받기 쉽지 않을 것이다.1
하지만 소비자 시장에서 AI가 성공하는 것은 매우 중요한 과제이다. 기술이 세상을 바꾸기 위해서는 결국 소비자의 삶을 바꿔야 되기 때문이고, 시장 규모로도 매우 큰 비중을 차지하기 때문이다. 생각해 보라. Google, Facebook, Apple, Amazon. M7 중 4개의 기업이, 소비자 대상 기업이라고 볼 수 있다.
지금은 아직 AI의 초입이다. 빠르면 2년, 길면 5년 안에 대중을 대상으로 AI를 사용한 서비스가 유의미한 성과를 올리고, 전세계 많은 사람들의 삶을 직접적으로 변화시킬 것이라 확신한다. 이러한 미래를 보다 효과적으로 대비하기 위해서는 AI가 그려낼 미래와, 여가시간의 활용이 지금까지 어떻게 변화 했는지에 대해 해상도 높게 그려보는 것이 중요할 것이다. 이를 통해 대중의 마음을 사로잡을 AI 콘텐츠들이 10년 후에 어떤 모습일지 예측하고, 그 목표를 위한 필수적인 조건들을 소개해보고자 한다.
더 나아가기에 앞서서, Consumer AI, Consumer 섹터라는 단어를 정의하고 싶다. 이 글에서 중점적으로 다룰 내용은, B2B로 제공되거나 B2C로 제공되지만 인간의 생산성을 높이는 “필수성과 효율성”을 띄는 서비스가 아닌, 대중의 관심을 끌고 부가가치를 생산하여 잉여자원을 소비하는 “오락성과 소통성”을 띄는 서비스들이다. 이런 “잉여 산업”이 인간에게 어떻게 생겨났고, 보편적인 Consumer(소비재) 시장에 어떤 영향을 끼치는지 알아보자.
Leisure Drives Consumer
Consumer 섹터의 역사는 기술이 우리 인간의 여가를 어떻게 재정의 했는가와 그 맥을 같이 한다. 산업 혁명 이후 인류는 역사상 처음으로 공급이 수요보다 많은 시장을 경험 했으며, 때문에 소비자의 지갑을 열기 위해 소비자의 관심을 확보하는 것이 중요한 세상이 되었다. 소비자의 관심을 확보하는 행위는 곧 소비자가 그들의 잉여 시간을 어떻게 소비하는지와 큰 관계가 있었고, 우리는 이를 여가라 불렀다.
따라서 시대에 따른 Consumer 섹터의 변화는 곧 시대에 따른 그들의 여가 수단 변화라고 말 할 수 있다. 더 나은 기술이 기존의 여가를 대체하면, 그곳에 대중의 관심이 새롭게 몰리고, 이곳에 광고와 소비재 산업이 따라오게 된다.
라디오가 발명되고, 소비자들은 그들의 잉여 시간을 라디오와 함께 보냈다. 그들은 라디오 광고를 보고, 라디오 속 소개된 제품을 구매했다. 그러다가 TV가 발명되어, 소비자들은 그들의 잉여 시간 대부분을 TV와 함께하기 시작했다. 이제 소비자들의 관심은 모두 TV에 쏠렸고, TV CF를 보고, 홈쇼핑을 보며, TV 속 소개된 제품을 구매했다. PC, 인터넷, 모바일의 발명 역시 소비자들이 잉여 시간을 보내는 방식을 바꾸었고(게임, SNS), 역시 이에 따라 소비재 제품의 트렌드가 형성되었다. 대다수의 인간들이 잉여 시간을 어떻게 보내는 지를 우리는 대중문화라고 부른다. Consumer 섹터는 이렇게 대중문화에서 시작하고 끝이 난다. 의/식/주와 같은 필수품부터 여행/뷰티에 이르기까지, 모든 Consumer 제품들이 이러한 패턴을 따른다.
따라서 AI가 Consumer 섹터를 어떻게 변화시킬 지 논의하기 위해서는, AI가 우리의 여가를 어떻게 재정의하여 대중의 잉여시간을 확보할지를 논의하는 것이 필수적이다.
역사적으로 소비자 트렌드의 빠른 변화는 다음과 같은 순간에 일어났다.
순수 재미/의미 측면에서 기존보다 월등히 나은 경험을 제공하는 혁신적 기술의 등장 (예: 컬러 영화)
유통망(플랫폼)의 변화 (예: 인터넷으로의 전환, 모바일로의 전환)
문화적 변화 (기술과 사회적 영향으로 대중 문화가 바뀔 때)
2024년 현재 대중은 주로 멀티미디어 콘텐츠 소비에 시간을 쓴다. 모바일 플랫폼의 틱톡, 인스타그램 릴스, 유튜브 쇼츠 같은 숏폼 비디오와 넷플릭스, 유튜브 뮤직 같은 스트리밍 서비스가 대중의 시간을 대부분 차지한다. Consumer AI 시대가 본격적으로 번성하려면, AI로 만들어진 컨텐츠들이 이런 기존 서비스들로부터 대중의 잉여 시간을 빼앗아야 한다. 프로덕트 관점에서 사용자 유지(retention)와 신규 사용자 확보(acquisition) 두 측면 모두에서 기존 서비스보다 주목할 만한 성과를 내야 한다는 뜻이다.
AI는 TV가 그랬던 것처럼, pc/인터넷이 그랬던 것처럼, 모바일이 그랬던 것처럼 다시 한번 인간의 여가를 재정의할 것이다. AI는 어떻게 우리의 여가를 재정의할 것인가? 이를 위해선 무엇이 필요할까?
What AI Will Enable
본격적인 논의에 앞서 AI는 무엇을 가능하게 해주는 기술인지 살펴보자.
인류가 진보의 길을 걸어온 것은 누군가가 더 강력한 도구를 발명하고, 이 도구가 인류를 많은 제약으로부터 해방시켜준 데에 있다.
기록(문자,활자혁명)은 인류를 시간의 제약으로부터 해방시켜주었다. 현재 우리는 200년 전 사람과도 이야기할 수 있다.
통신(통신망,인터넷,모바일)은 인류를 공간의 제약으로부터 해방시켜주었다. 현재 우리는 상대가 어디에 있든 소통할 수 있다.
물리적 도구(쟁기/바퀴/증기기관)는 인류를 육체 노동의 제약으로부터 해방시켜주었고, 컴퓨터는 인류를 지식 노동의 제약 중 반복 작업으로부터 해방시켜주었다.
AI는 인류를 지식 노동의 제약으로부터 완전히 해방시켜 수 있는 역사상 가장 강력한 도구이다. 지식 생산의 비용을 0으로 만들어, 많은 것들을 가능하게 할 것이다.
생산성 혁명은 곧 특권 확대로 이어진다. 현재 인류는 과거 파라오가 누리지 못한 사치들을 누리며 산다는 이야기는 유명하다. AI는 그동안 너무 비싸 부자들의 특권으로만 여겨졌던 많은 값비싼 지식 서비스를(헬스케어, 교육 등) 모두에게 확대시켜줄 것이다. AI는 그동안 시간과 리소스가 부족해 창작 활동을 하지 못했던 많은 예비 예술가들이 자원의 걱정 없이 창작할 수 있는 세상을 만들어줄 것이다. 생산성의 부족으로 그동안은 차마 생각지도 못하고, 만들지 못했던 창작물을 만들 수 있는 세상이 올 것이다. 바야흐로 인류 역사상 유래없는 풍요의 시대이다. 이 시대, AI는 인류의 여가 활동에 있어 어떤 것들을 새롭게 가능하게 만들어줄까?
How AI is Reshaping Our Free Time
위에서 AI가 어떤 기술인지 알아보았다면, 이번 단락에서는 AI가 우리의 여가를 어떻게 바꿀 수 있을지 이야기해보자. 이를 위해 산업혁명이 우리의 여가를 어떻게 바꾸었는지 먼저 살펴보는 것이 중요하다. AI와 산업혁명은 모두 인류 역사상 유례없는 생산성 향상을 가져온 기술이라는 공통점이 있다. 산업혁명은 육체노동을, AI는 지식노동을 혁신했다.
산업혁명은 인류의 여가를 근본적으로 변화시켰다. 생산성의 증가로 노동자들의 여가 시간이 늘어났고, 대량 생산으로 책과 잡지 등 기존에는 값비쌌던 문화 상품이 저렴해지고 대중들에게까지 확대되었다. 또한 기존에는 인간의 노동력으로는 불가능했던 동력을 활용해 새로운 여가 상품(테마파크 등)이 개발되었다.
산업혁명의 사례를 통해 우리는 생산성 혁명이 여가에 미치는 세 가지 주요 영향을 파악할 수 있다:
여가 시간의 증가
생산성 향상으로 노동 시간이 줄어들고 개인의 자유 시간이 늘어난다.
문화 상품의 대중화
대량 생산으로 인해 이전에는 고가였던 문화 상품의 가격이 낮아지고 접근성이 높아진다.
혁신적인 여가 상품의 출현
새로운 기술을 활용하여 이전에는 상상도 못했던 형태의 여가 활동이 가능해진다.
이러한 패턴을 고려할 때, AI 시대에도 비슷한 변화가 일어날 것으로 예상할 수 있다. 그렇다면 지식 노동의 생산성 혁명인 AI는 구체적으로 우리의 여가를 어떻게 바꿀까?
AI-Powered “Theme Parks”
AI는 산업혁명이 테마파크를 탄생시켰던 것처럼, 우리가 여가 시간에 즐기는 모든 창작 콘텐츠를 근본적으로 변화시킬 것이다. 영화, 책, 만화, 게임, TV 등 우리가 현실 도피와 지적 즐거움을 위해 소비하는 모든 콘텐츠 영역이 AI에 의해 재정의될 것이다.
산업혁명 이전의 놀이 공원은 인간이나 동물이 놀이 기구의 동력을 담당했다. 따라서 놀이 기구의 수나 다양성, 제공할 수 있는 경험이 인간과 동물의 노동력에 제약되어 있었다. 산업혁명은 이러한 제약을 제거해 인간과 동물이 낼 수 없었던 수준의 동력을 활용한 새로운 놀이기구(자이로 드롭, 범퍼카, 롤러코스터)를 만들었다. 더 다양하고, 더 방대한 놀이 공원을 만들 수 있게 해주었다. 테마파크는 그 자체로 산업혁명이 불러온 생산성 혁명의 결정체라고 말할 수 있다. 테마파크는 인간을 육체 노동의 제약에서 벗어나게 해준 기술이 얼마나 다양하고 재미있는 여가 경험을 제공할 수 있는지를 보여준다.
AI도 우리에게 새로운 테마파크를 제공해줄 것이다. 이번에는 지식 노동의 제약에서 벗어나면서 말이다.
현재 우리의 여가 활동 중 상당 부분은 다양한 형태의 창작 콘텐츠를 소비하는 데 할애된다. 이러한 콘텐츠들은 우리에게 현실 도피의 기회를 제공하고, 새로운 세계를 경험하게 해주며, 지적 자극을 준다. 그러나 지금까지 이러한 콘텐츠의 창작은 전적으로 인간의 몫이었다. 이는 마치 산업혁명 이전에 말이 직접 회전목마를 끌던 것과 같다.
AI의 등장으로 이 모든 것이 변화할 것이다. 그 변화는 다음과 같은 형태로 나타날 것이다:
1. 방대하고 복잡한 세계관의 창조
현재 인간 창작자들이 만들어내는 세계관은 그 복잡성과 규모에 한계가 있다. AI는 이 한계를 뛰어넘어 전례 없는 규모와 복잡성을 가진 세계를 창조할 수 있다. 이는 마치 증기 기관이 인력으로는 불가능했던 힘을 발휘한 것과 같다.
예를 들어, AI는 인류 역사 전체를 아우르는 게임 세계관을 만들어낼 수 있다. 이 세계에서는 모든 역사적 사건이 서로 연결되어 있고, 플레이어의 작은 행동 하나가 수천 년에 걸친 역사의 흐름을 바꿀 수 있다. 또는 수천 년에 걸친 가계도와 복잡한 정치적 관계를 가진 판타지 소설의 세계관을 순식간에 만들어낼 수 있다. 이러한 세계관은 그 깊이와 일관성 면에서 인간 창작자가 만들어내기 힘든 수준의 것이 될 것이다.
2. 실시간 무한 콘텐츠 생성
AI는 사용자의 요구에 따라 실시간으로 새로운 콘텐츠를 무한히 생성할 수 있을 것이다. 이는 콘텐츠 소비 방식 자체를 근본적으로 변화시킬 수 있다. 마치 산업혁명이 대량 생산을 통해 상품의 가용성을 혁명적으로 늘렸듯이, AI는 콘텐츠의 가용성을 무한대로 확장시킬 것이다.
예를 들어, 끝나지 않는 TV 시리즈를 상상해보자. 이 시리즈는 시청자의 반응과 선호도에 따라 실시간으로 새로운 에피소드를 생성한다. 주인공이 어떤 선택을 하느냐에 따라 이야기가 완전히 다른 방향으로 전개될 수 있고, 이는 매 시청자마다 다른 버전의 이야기를 경험하게 만든다.
우리가 과거 인간과 말에 의해 움직이던 놀이 공원으로 돌아갈 수 없듯이(너무나 시시해서), 10년 뒤에는 인간에 의해 창작된 컨텐츠를 시청하던 세상으로 절대 돌아갈 수 없을지도 모른다. AI는 이제까지의 컨텐츠 경험을 완전히 변화시킬 것이다.
Everyone can be a producer
AI의 발전으로 누구나 컨텐츠를 제작할 수 있는 시대가 도래할 것이다. 여기서 말하는 생산자는 직접 컨텐츠를 창작하는 사람이 아닌, AI를 활용해 컨텐츠를 기획하고 관리하는 디렉터를 의미한다. 10년 후, 우리는 모두 디즈니, 지브리, 마블의 디렉터가 될 수 있을 것이다.
AI는 컨텐츠 제작 과정의 많은 부분을 대체할 것이다. 영화를 예로 들면, 음악, 디자인, 에셋, CG, 심지어 배우까지 AI가 담당할 수 있다. 촬영 자체도 생성형 그래픽으로 대체될 수 있다. 물론 모든 것을 AI가 대체할 순 없겠지만, 100명이 1년 걸릴 일을 1명이 하루 만에 할 수 있게 만들어 창작 과정 전체를 재정의할 것이다.
이러한 변화 속에서도 인간의 기획과 품질관리 역할은 여전히 중요할 것이다. AI로 모두가 창작을 하는 세상에서 차별화는 인간의 고유한 기획과 검수에서 발생할 것이기 때문이다. 컨텐츠업의 본질인 '사람의 마음을 움직이는 것'이 더욱 중요해질 것이며, AI를 효율적으로 활용하는 능력 또한 중요해질 것이다. 동시에 반대 극단에서 인간만이 만들어낼 수 있는 독특한 창작물의 가치도 높아질 것이다. 이는 인터넷이 발전하며 오프라인만이 줄 수 있는 경험을 극대화한 팝업 스토어/편집샵이 발전한 것과 유사하다.
더 많은 창작자의 탄생은 무엇을 의미할까? 2024년 현재 1380만명의 유튜브 영상 제작자가 있으며, 유튜브에는 하루 370만 개, 틱톡에는 3400만 개의 영상이 업로드된다. 이러한 규모는 전통 미디어와 비교했을 때 더욱 놀랍다. 유튜브에서 2개월 동안 업로드되는 영상의 양은 미국의 주요 방송사(ABC, CBS, NBC)가 60년 동안 제작한 콘텐츠를 넘어선다. 이는 인터넷과 스마트폰이 만들어낸 새로운 창작 생태계가 과거와는 비교할 수 없을 정도로 풍부해졌음을 의미한다.
2034년에는 이러한 현상이 고품질 콘텐츠 시장으로 확장될 수 있다. 수백만 명의 영화 감독, 게임 디렉터, 애니메이션 디렉터가 활발하게 작품을 선보이는 세상을 상상해보자. 이는 새롭고 다양한 컨텐츠의 폭발적 증가로 이어질 것이며, 그 중에는 많은 명작이 탄생할 것이다.
이러한 풍요 속에서 우리는 개인의 취향을 완벽히 반영한 작품들을 즐기게 될 것이다. 이는 문화 상품의 진정한 대중화를 의미한다. 역사적으로 창작자의 증가는 항상 개인의 취향을 더욱 세분화하고 발전시켰다. 높은 제작 비용과 소수의 생산자로 인해 우리는 그동안 대중을 겨냥한 컨텐츠에 의존할 수밖에 없었다. 고가의 상품일수록 그 경향은 두드러졌다. 수익성이 낮았기 때문이다. 하지만 AI로 인한 비용 감소와 생산자의 증가는 이 패러다임을 바꾸어 다양한 니치 시장의 소비자들에게 맞춤형 컨텐츠를 제공할 수 있게 될 것이다.
유튜브와 숏폼 플랫폼의 성공 사례는 이러한 변화의 전조였다. 스마트폰 카메라의 발전으로 누구나 쉽게 영상 컨텐츠를 제작할 수 있게 되면서, 다양한 니치 컨텐츠가 폭발적으로 증가했다. 낚시, 주식, 등산, 클라이밍, 칵테일 제조 등 특정 관심사에 집중한 버티컬 컨텐츠들이 등장하며 소비자의 선택폭이 넓어졌다.
AI는 창작의 민주화를 가속화할 것이다. 제작 비용을 극적으로 낮춰, 누구나 블록버스터급 영화, 게임, 음악, 소설을 만들 수 있는 시대가 도래할 것이다. 개인의 인생을 담은 블록버스터 영화 제작은 더 이상 비현실적인 꿈이 아니다. AI는 창작의 장벽을 허물어, 모든 이가 뮤지션, 게임 디자이너, 소설가가 될 수 있는 세상을 열 것이다. 이러한 변화는 계몽주의 철학이 이상으로 삼았던 개성(Individuality)이 충분히 발현되는 사회를 실현할 수 있게 한다. 우리는 자신의 취향과 가치관에 완벽히 부합하는 고품질 컨텐츠를 언제든 즐길 수 있게 될 것이다. 나만을 위한, 나의 삶을 반영한 작품을 만드는 것 또한 현실이 된다. 우리는 개개인의 다양한 취향이 존중받고, 그 취향을 만족시킬 수 있는 풍요로운 문화 생태계 속에서 살아가게 될 것이다.
Sensory Revolution
AI는 보이스, 영상을 넘나들며 컴퓨터와 소통하는 경험을 제공한다. 이러한 멀티모달 경험은 ‘재미’ 측면에서 기존보다 더 재미있을 수 있다. 예를 들어 꿈 속에서 나올 법한 비현실적인 장면들을 Sora, Runway, Pika와 같은 서비스를 통해 제작해 시청할 수 있다. 실시간으로 아바타와 영상 통화를 하며 여가를 보낼 수도 있다. 기존의 2D 디바이스에서 시각으로 시청만 하던 것에서 벗어나, 3D 영상을 360도로 보고, 음성으로 말도 하고, 몸짓으로 소통도 하는 인간다운 인터페이스를 경험 할 수 있다.
이런 세상에선 무엇이 더 중요해질까? AI가 제공하는 다양한 감각 경험을 100% 느낄 수 있는 최적의 디바이스가 필요해질 것이다. 음성으로 소통하고, 몸짓으로 이야기 하고, 표정으로 서로 반응을 공유하는 인터페이스를 가진 새로운 디바이스가 출현할 것이다.
MR 디바이스가 이 디바이스의 적합한 후보일 수 있다. Quest3, Vision pro와 같은 HMD는 3D 세상을 효과적으로 경험할 수 있는 기기이다. 음성과 몸짓으로 AI와 효과적으로 소통할 수 있는 기기이다. 따라서 미래에는 MR 디바이스가 우리의 여가 시간을 보낼 때 착용하는 대표 기기가 될 것이다. 이는 콘서트,방탈출 등 기존에 오프라인에서만 100% 가능했던 경험을 온라인에서도 즐길 수 있게 만들어준다. 기존에는 대체될 수 없는 감각이라고 여겨졌던 해변에 누워있거나, 숲속을 탐험하고, 벼룩시장에서 쇼핑할 때 느끼는 즐거움을 온라인에서도 즐길 수 있게 해준다. 이는 ‘재미’ 측면에서 기존보다 나은 발상이기에 우리의 여가를 재정의할 수 있다.
상상해보자. 우리가 꿈에서 꾸었던 비현실적인 판타지 세상을 몰입감 넘치게 경험하며 여가 시간을 보내는 순간을.
상상해보자. 우리가 3D 아바타와 얼굴,몸짓,목소리를 모두 사용해 실제 인간과 대화하듯 대화하며 여가 시간을 보내는 순간을.
상상해보자. 우리가 평생 가보지 못한 우주 속 풍경을 거닐고, 에베레스트 산맥을 등산하며 여가 시간을 보내는 순간을.
조금이라도 지금보다 재미있고 흥분되는가? 그렇다면 이것이 우리 인류의 여가를 재정의할 미래이다.
The Future is already here
‘미래는 이미 와 있다, 다만 퍼지지 않았을 뿐’ 이라는 말처럼, 이미 미래는 시작되고 있다. 미래 인류의 여가를 엿볼 수 있는 사례를 살펴보자.
Social * AI
Social은 소비자 섹터에서 가장 중요한 산업 중 하나이다. Social은 그자체로 대중의 관심이 모이는 곳이기에 광고의 시작이 되어 소비재 산업에 영향을 주기 때문이다. AI로 기존 사회적 경험보다 더 나은 경험을 제공할 수 있다면, 이는 큰 변화의 시발점이 될 것이다.
그렇다면 10년 뒤 SNS 경험은 어떻게 변화할까? AI Companion과 새로운 형태의 사회적 관계를 형성하는 세상이 올 것이다. AI Clone으로 나의 일상/지식을 언제나, 자세히 공유할 수 있는 세상이 올 것이다.
SNS 산업의 변하지 않는 본질은 무엇일까? 인간의 사회적 욕구이다. 이 욕구는 인간 실존의 문제인 고립, 불안에 종속되어 있다. 고립과 불안에서 벗어나기 위해 1)연결되고 싶고, 2)관심/인정 받고 싶고, 3)타인의 삶을 알고싶은 사회적 욕구가 우리 인간에게는 내재되어 있다.
기술이 발전되며, 인간의 사회적 욕구 해소에 대한 제약은 점점 줄어들었다. 기록/활자가 발명되며 시간의 제약 없이 연결될 수 있었고, 인터넷/모바일이 발명되며 공간의 제약 없이 연결될 수 있었다. 나의 삶을 표현/자랑하는 수단도 기술과 함께 발전했다. 인터넷이 나오면서 나의 일상을 텍스트와 간단한 이미지로 블로그/SNS를 통해 표현할 수 있었다. 스마트폰이 나오면서 나의 일상을 1)실시간 2)사진 기반으로 표현할 수 있었다. 지속적인 스마트폰,통신망,컴퓨팅 파워의 발전으로 지금 우리는 우리의 일상을 비디오로 표현하고 있다.
AI Companion
AI Companion은 인간의 연결 욕구를 충족 시켜줄 수 있는 더 나은 발상이다. 현대 사회 인간의 연결 욕구를 충족시켜주는 수단인 인간관계는 전세계 모두가 누릴 수 있는 것이 아니다. 다시 말해, 인간관계도 사회적 역량을 인정 받은 사람만이 누릴 수 있는 특권이다. AI Companion은 이 특권을 모두에게 확대시켜, 사회적 역량이 부족해 인간관계의 기회를 누리지 못한 이들도 사회적 욕구를 충족시킬 수 있게 해줄 것이다.
한편, 인간관계를 잘 누리는 사람들 역시 사회적 욕구를 충족하는데에 제약이 있다. 바로 에너지이다. 인간관계를 유지하기 위해서 우리는 에너지를 사용해야 하고, 시간과 돈을 사용해야 한다. 때문에 내가 원할 때, 원하는 만큼의 사회적 욕구를 인간관계를 통해 언제나 충족시킬 수 있지 않다. 나의 인간관계 속 사람이 에너지가 될 때만 사회적 욕구를 충족시킬 수 있다. AI는 이러한 측면에서도 우수하다. 밤이든, 낮이든, 언제 어디든 내가 원할 때 나와 사회적 상호작용을 해줄 수 있다. 언제나 나를 주인공으로, 나에게 맞춰서 사회적 상호작용을 해줄 수 있다. 이는 사회적 욕구를 충족시켜주는 더 나은 발상이다.
이미 시장에서 AI Companion2 제품들이 인정받고 있다. Character ai, Replika의 일평균 체류시간은 이미 수시간이다. Replika의 경우 우울증 예방에 효과가 있다는 많은 심리 논문과 사례가 보고되고 있다. talkie, friend.ai 등 수많은 ai companion 앱들이 대중의 관심을 받고 있고, 높은 리텐션을 보이고 있다.
아직 그 수요가 대중으로까지 확장되진 않았지만, 불안정함에도 불구하고 AI Companion 제품들이 달성해낸 리텐션 수치, 고객들이 직접 겪은 생생한 가치를 생각하면 그 효용은 증명되고 있는 것 같다.
AI가 더 발전하고, AI의 Context Window(맥락을 저장하는 창)가 늘어나 내 개인 정보를 방대하게 주입할 수 있다면 AI Companion은 더 좋은 고객 경험을 제공할 것이다. 세상에 나의 사회적 욕구를 100% 충족시켜줄 수 있는 완벽한 인간관계는 없다. 하지만 AI는 이러한 자명한 명제 역시 뒤바꿀 지도 모른다. 10년 뒤에는 우리 모두가 우리만을 위한 AI Companion과 상호작용하며 다양한 사회적 욕구를 충족시킬 수 있을 것이다. 언제나 나를 긍정적으로 지지해주고, 잘못된 길을 가고 있을 때는 비판해주고, 언제나 내 상태를 큰 시간과 에너지를 써서 신경써주는 친구,멘토,가족이 우리 모두에게 주어질 것이다.
10년 뒤에는 태어날 때부터 AI Companion과 교류한 세대들이 생겨날 것이다. 그보다 더 먼 미래에는 대중문화를 이끄는 대다수의 사람들이 어릴 때부터 AI Companion과 함께한, AI Native 세대가 될 것이다. 우리에게 친구의 한 종류로서 AI Companion이 당연한 세상이 머지 않았다.
AI Clone
AI Clone이 우리의 일상을 언제나 정성을 다해 공유하는 세상이 올 것이다. 인터넷과 모바일의 발달로 우리는 우리의 일상을 실시간으로 다수의 사람에게 공유할 수 있었다. 하지만 여전히 1:1로 고관여로 일상을 공유하고 소통하는 데에는 많은 리소스가 소모되었다. 나의 SNS 팔로워 모두와 매일 1:1 대화를 하는 것은 현실적으로 불가능하다. AI는 이 제약을 없애줄 것이다. 관심있는 사람의 클론과 언제든지 대화할 수 있을 것이다. 나의 일상을 클론이 대신해서 다수에게 공유해주면, 관여도가 높은 상대 혹은 내가 더 관심 있는 사람들을 직접 골라 그들과는 내가 직접 이야기할 수 있을 것이다.
이러한 변화는 소개팅 시장과 인플루언서(크리에이터) 시장에서 먼저 시작될 것이다. 누구보다 다수의 사람들과 고관여로 대화하는 것이 중요한 시장이기 때문이다. 또 인플루언서의 경우, 그들의 개인 데이터가 인터넷에 축적되어 있어 더 정확한 AI Clone을 만들 수 있을 것이다.
실제로 메타는 지난 4월 인스타그램의 실험적 기능으로, 인플루언서가 AI Clone을 제작할 수 있는 서비스를 공개하기도 했다. 캐린 AI도 흥미롭다. 270만 인플루언서 캐린의 데이터를 학습해 만든 이 챗봇은 출시 일주일만에 약 1억원의 매출을 발생시켰다. 인플루언서와 여자친구처럼 통화할 수 있는 경험을 제공한 것이 고객들의 큰 호응을 얻은 것이다.
미디어에서도 빠르게 변화가 시작될 것이다. 좋아하는 Substack 작가와 흥미로운 주제에 대해 깊게 얘기할 수 있는 경험은 기존의 미디어보다 더 나은 경험이다. 누구나 버핏과 가치 투자에 대해 이야기하고, 일론 머스크와 화성 탐사에 대해 이야기하고, 폴 그레이엄과 스타트업에 대해 이야기할 수 있는 세상이 머지 않았다.
Content * AI * MR
그럼 이번엔 AI가 컨텐츠 시장을 어떻게 더 매력적으로 만들지에 대한 힌트를 알아보자. 앞서서 얘기했던 것처럼, 현재 대중들이 주로 소비하는 컨텐츠는 비디오이다. AI가 대중들에게서 비디오를 시청하는 데 쓰는 시간을 뺏어오려면, 1) 현재 비디오 포맷을 유지한 채 더 다양하고/재미있는 비디오 경험을 제공하거나, 2) 비디오 포맷보다 더 나은, 새로운 포맷(3D / Immersive Video)으로 현재보다 재미있는 경험을 제공해야 한다. 두 방향 모두에서 흥미로운 시도들이 이어지고 있다.
Multimodal AI content
Video model을 활용해 영상 제작의 특권을 확대하는 시도들이 이어지고 있다. Video model이 장기적으로 발전함에 따라, 이러한 시도들 중 하나가 기존 비디오 경험보다 나은 경험을 제공할 수 있다. 누구나 쉽게 고퀄리티 비디오를 제작할 수 있게 되면서, 다양한 취향과 다양한 카테고리에 특화된 컨텐츠의 풍요가 올 것이다.
현재 유튜브,틱톡과 같은 기업들은 방대한 크리에이터와 2D 비디오를 해자로 가지고 있다. 하지만 기존에 없던 일반인이 만든 /블록버스터/애니메이션/영화가 컨텐츠 시장의 주류가 되면 그 해자는 무너질 것이다. 새롭게 공급자 DB, 크리에이터 생태계를 구축해야하는 판이 재정의 되는 시기이기 때문이다. 이를 잡는 기업이 Next 유튜브 next 틱톡 next 디즈니가 될 것이다. Viggle.ai의 도전이 주목할만하다. 캐나다의 스타트업인 이 기업은 누구나 쉽게 자신만의 영상을 만들 수 있는 도구를 만들어 400만 사용자를 모았고, a16z에게 $19M를 펀딩 받았다.
3D Immersive MR Content
기존의 2D 비디오 컨텐츠보다 고객 가치 측면에서 더 나은 경험을 제공할 수 있는 새로운 포맷은 무엇이 있을까?
3D MR 컨텐츠를 주목할 만 하다. MR 기기를 쓰고 완전히 현실과 같은 몰입형 경험을 제공하는 경험은 전달력 측면에서 분명 더 나은 발상이다. 하지만 현실은 녹록지 않다. MR 디바이스도, 3D 컨텐츠도 이미 존재하지만, 아직 2D 비디오 컨텐츠를 고객 가치 측면에서 넘어서지 못했다. 그 이유는 무엇일까? 3D 컨텐츠를 만들기에 드는 리소스와, 디바이스의 가격과 접근성 때문이다. vision pro 3D Content를 만드는 레딧의 한 유저의 말에 따르면 3D Content는 촬영부터 제작까지 너무 많은 비용과 시간이 소요된다고 한다. 이를 잘 수행할 수 있는 기술자들도 현재 극히 적다. MR 디바이스의 경우 Apple Vision Pro의 가격(3500$)으로 볼 수 있듯이 여전히 너무 비싸고, 비교적 저렴한 퀘스트3 역시 일상적으로 접근할 수 있는 접근성을 갖추지 못했다 (무게, 휴대성, 배터리 타임, 킬러앱의 부재 등).
AI가 그 해답이 될 수 있다. Sora, Runway, Pika와 같은 video model이 발전하고 보급화되면 3D 컨텐츠를 만드는 것이 더 쉬워진다. 3D 에셋을 만드는 것 역시 쉬워지고 있다. 누구나 자신의 상상을 3D 컨텐츠로 실감나게 담아낼 수 있어 기존 컨텐츠와는 완전히 새로운 컨텐츠들이 쏟아져 나올 수 있다.
물론 3D 라고 해서, 기존에 잘 만들어진 2D 컨텐츠보다 더 재미있다는 보장은 없다. 3D Video AI가 보편화 되더라도 초기에는 재미나 컨텐츠의 완성도 측면에서 부족한 3D 컨텐츠만 존재할 가능성이 크다. 하지만 아래 3가지 조건이 충족되면, 3D 컨텐츠가 주류로 급부상할 수 있다.
3D 비디오 포멧이 기존의 2D 비디오보다 더 나은 고객 경험을 제공하는가? (단 한 측면만에서라도)
AI로 3D 컨텐츠를 제작하는 크리에이터가 많아졌는가?
3D 컨텐츠를 잘 보여줄 수 있는 적합한 디바이스가 가정에 보급되었는가?
3가지를 모두 충족한다는 것은 어려운 일일 것이다. 하지만 전혀 불가능한 시나리오가 아니다. 오히려 장기적인 관점에서 확률 높은 시나리오일 수 있다.
이는 마치 스마트폰 초기, 모바일에서 시청하는 영상들이 주목받지 못했던 것과 같다. 2007년 모바일 초기 유튜브에 영상을 업로드 하는 크리에이터는 극히 적었다. 스마트폰의 발전과 통신망의 발전으로 질 좋은 모바일 영상을 만드는 크리에이터들이 늘어났고, 스마트폰이 보편화되면서 적어도 모바일(언제/어디서든) 상황에서 만큼은 소비자의 선택을 받을 수 있었다.
지난 20년 동안 멀티미디어 파일의 통신 속도는 약 100배 빨라졌다. 20년 전에 존재하지도 않았던 직업인 컨텐츠 크리에이터는 현재 2억 7백만명이 있다. 20년 전, 불편하기만 했고 아무도 쓰지 않았던 스마트폰은(그 개념조차 지금의 것과 달랐던) 현재 48.8억명이 사용한다.
모바일 컨텐츠 시장도 3D 컨텐츠 시장과 똑같이 대중화를 위한 많은 조건이 붙어있었다. 그리고 그 조건들은 실현 되기에 불가능해보였다. 하지만 인터넷과 모바일이라는 시대의 흐름은 모바일 컨텐츠 시장의 대중화에 상승 압력을 주었고, 결국 모바일 컨텐츠는 우리의 일상이 되었다.
3D도 마찬가지일 것이다. 처음에는 기존 2D 비디오 컨텐츠가 고객 가치 측면에서 우월할 것이다. 크리에이터가 많이 존재하고, 고객들이 익숙하고, 고객들의 재미를 위해 최적화된 시장이기 때문이다. 하지만 AI기술이 발전하고, MR 디바이스가 조금 더 보급화될 2년 후쯤에는 아주 몇몇이 MR 디바이스를 활용해 몰입감 넘치는 경험을 느낄 수 있는 그 순간에 3D 컨텐츠를 즐겨 찾게 될 것이다. 그리고 점점 기기가 보급되고, AI Model이 싸지면서 크리에이터가 많아지며 어느 순간 재미 측면에서, 일상성(retention) 측면에서 우리 대중에게 더 나은 발상이 되어 있을 것이다. 이 때 컨텐츠 시장의 판도가 완전히 재정의 될 것이다.
이 때 우리는 어떤 컨텐츠를 소비할까? 콘서트, 뮤지컬, 스포츠 경기처럼 직관 해야 만 그 가치를 온전히 느낄 수 있었던 경험을 온라인으로 재현하는 컨텐츠들이 나타날 것이다. 여행도 비싼 비행기표를 구매해 가지 않아도 온라인에서 즐길 수 있을 것이다. 누구나 픽사 같은 3D 에니메이션을 빠르게 제작할 수 있어 개개인의 상상력을 담은 비현실적인 컨텐츠들이 쏟아질 것이다. 우리가 잠 잘 때 꾸는 꿈 속 세상을 경험할 수 있는 컨텐츠들도 등장할 수 있다. 이러한 컨텐츠들은 기존에는 없던(있어도 너무 비싸서 그 수가 적었던) 새로운 발상이다. 역사적으로 새로운 컨텐츠들이 쏟아질 때 컨텐츠 시장은 변화했다. 대중은 늘 새로운 것을 좇고, 그 새로운 것이 기존과 색다르고 더 재미있는 경험을 제공할 수 만 있다면 기꺼이 돈을 지불한다. 그리고 그것이 처음부터 당연했었던 것처럼 생각한다. 마치 지금 대중들이 20년 전에는 상상도 못했던 숏폼 비디오 컨텐츠를 시청하며 이것을 당연하게 여기는 것처럼 말이다. 10년 뒤에 우리는 일상에서 모두의 꿈을 몰입감 있게 시청하고, 비현실적인 판타지를 체험하고, 여행을 다니고, 뮤지컬을 보며 시간을 보낼 것이다.
Key Pillars of Consumer AI Evolution
하지만 가만히 앉아서는 앞에서 제시한 세상에 도달할 수 없다. 우리가 꿈꾸는 미래에 도달하기 위해 필요한 것은 무엇이 있을까? 핵심적인 3가지 드라이버에 대해 살펴보자.
Enhancing AI Accessibility
우선, AI의 접근성이 올라가야 한다. 이는 AI 활용이 스마트폰만큼 일상화되어야 함을 의미한다. 현재 상황을 살펴보자. 2024년 한 연구에 따르면 미국인의 55%가 일상에서 AI를 사용하고 있다. 그러나 이는 스마트폰 사용률(90%)에 비해 여전히 낮은 수준이며, 특히 다양한 AI 도구를 활용하거나 멀티모달 AI를 이용해 콘텐츠를 제작하는 사람들의 비율은 더욱 낮다. 목표는 AI 활용이 스마트폰만큼 일상화되고, AI 활용 능력 향상을 위해 노력하는 사람들의 비율이 인터넷 사용률에 근접하는 것이다. 특히 영상 AI 분야에서 이러한 보급 수준이 달성되어야 한다. 그래야만, AI가 대중의 여가를 재정의할 수 있다.
이를 위한 방안으로는 먼저 스마트폰 생태계와의 통합을 들 수 있다. 예를 들어, Apple은 OpenAI와의 파트너십을 통해 ChatGPT를 iOS, iPadOS, macOS에 통합할 예정이며, 이는 AI 생태계가 10억 이상의 Apple 사용자를 확보할 수 있는 기회이다. 통신사와의 통합도 중요한 방안이다. Perplexity는 SKT, 소프트뱅크와의 제휴를 통해 자사 서비스를 유통하고 있으며, 통신사의 방대한 고객풀에 접근할 수 있는 기회를 얻었다.
앞으로 이러한 흐름은 가속될 것이다. 스마트폰과 통신사 계층에 AI가 통합되며, 가격이 패키징되고, 온디바이스에서 무료로 작동하는 AI 기능이 생겨나며 AI는 우리의 일상에 자리잡을 것이다. Canalys의 예측에 따르면, 2024년 말까지 새로 출시되는 스마트폰의 16%가 생성형 AI 기능을 탑재할 것이며, 2028년까지 그 비율이 54%에 도달할 것으로 전망된다.
AI 앱 보급률 향상도 중요한 과제다. 현재 ChatGPT(MAU 2억 추정)를 제외하고는 뚜렷하게 소비자의 일상에 자리 잡은 AI 앱이 드물다. 이는 AI 앱 개발 기업들의 수익 구조와 관련이 깊다. LLM 모델이 주요 변동비인 AI 앱은 기존의 무료 가격 정책을 실시할 수 없어 유료 구독 모델로 주로 운영된다. 이는 소비자들에게 큰 부담이 된다. chat gpt에게 20달러를 지불하고, 다른 앱에 또 그만큼의 금액을 지불하는 것은 엄청난 부담이다. 하지만 AI 모델 비용은 지속적으로 감소하고 있고, 10년 뒤에는 거의 공짜에 가깝게 사용할 수 있을 것이다. 이러한 비용 변화에 민감하게 반응해 고객 친화적인 새로운 가격 정책을 펼치고, 제품을 만드는 팀이 유리한 위치에 설 수 있다.
The Inevitable Shift to Multimodal AI
다음으로, 비디오 생성/추론 모델의 성능이 올라가야 한다. AI는 빠르게 멀티모달로 나아가고 있지만, 여전히 비디오 생성/추론 모델은 개발자들에게 너무 비싸고, 소비자들에게는 그 결과물이 기존의 인간이 만든 비디오보다 제공하는 가치가 현저히 떨어진다. 현재 대표적인 비디오 생성 모델인 RunwayMl의 Gen-3 모델은 월 $15에 6개의 10초 비디오만 생성 가능하고, 그 품질마저 실망스럽다.
따라서 더 저렴하고, 빠르고, 사용자 친화적인 비디오 모델과 서비스의 출현이 필수적이다. 그런 면에서 Sora에 기대를 걸고 있다. Sora는 24년 2월 공개되며 많은 대중들의 호응을 얻었다. Sora의 인터페이스가 얼마나 사용자 친화적일지, 비용이 어느정도일지 아직은 알 수 없지만 그 성능만큼은 기존의 인간 비디오를 대체할 가능성을 가졌다 생각한다. 또한 많은 크리에이터들과 openai가 Sora를 테스트 중이니, 늘 그랬듯 사용자 친화적인 제품으로 빠른 시일 내에 대중들에게 공급할 것이라 기대한다.
Sora가 업계의 기준을 끌어올린다면, 비디오 생성/추론 시장은 급격히 발전할 것이다. 이제는 정말로 누구나 기존에는 높은 비용과 시간이 들었던 비디오를 쉽게 만들 수 있을 것이다. 제작의 제약조건 없이 더 나의 의도와 취향을 담은 비디오를 만들 수 있을 것이다. 그렇다면 기존 Consumer들의 시간을 빼앗은 비디오 컨텐츠보다 AI로 제작된 비디오들이 고객 가치 측면에서 더 나은 발상이 될 수 있지 않을까? Video 섹터에서 소비자의 시간을 차지하는 AI 기업이 Consumer AI의 포문을 열 것이다.
The Optimal Interface for Multimodal AI
멀티 모달 AI의 성능이 충분히 발전해도 여전히 남은 과제가 있다. 바로 멀티 모달 AI의 성능을 100% 활용할 인터페이스의 부재이다. 우리가 AI를 통해 제작된 3D 비디오를 시청하는 인터페이스는 무엇인가? 우리가 AI와 영상통화하는 인터페이스는 무엇인가? 모두 스마트폰(혹은 PC)이다. 이는 멀티 모달 AI의 성능을 100% 활용한다고 볼 수 없다. 10년 뒤 AI에게는 눈도,입도,표정도 생길 것이다. 그런 AI를 여전히 한정된 2D 디바이스에 갇혀서 봐야할까? 물론 그렇게 봐도 좋겠지만, AI가 제공할 수 있는 경험의 최대치를 이끌어낸다고는 말할 수 없을 것이다.
역사를 살펴보면 기술의 성능을 100% 활용하지 못하는 인터페이스는 그 성능을 100% 활용하게 해주는 인터페이스에게 대체되어 왔다. 스마트폰도 마찬가지일 것이다. 10년 뒤, 우리가 여가 시간을 함께 보내는 AI 친구는 스마트폰에 있지 않을 것이다. 우리가 여가 시간에 AI 콘텐츠를 시청하는 디바이스는 스마트폰이 아닐 것이다.
멀티 모달 성능을 온전히 활용할 수 있는 MR 디바이스가 스마트폰의 자리를 차지할 것이다. 다시 말해, 인류는 잉여 시간을 MR 디바이스와 함께 보내게 될 것이다. Apple Vision Pro를 쓰고 타인의 삶을 몰입감 넘치게 훔쳐보고, 풍부한 3D 영상을 시청하며, AI 아바타와 한 공간에서 마주보며 이야기하듯 생동감 넘치게 대화할 것이다.
이를 위해서는 무엇이 필요할까? 2가지가 필수적이다:
1) 3D 컨텐츠 제작의 접근성 향상, 2) MR 디바이스의 접근성 향상.
1번은 앞서서 얘기한 Multi Modal AI의 발전이 해결해줄 것이다. 한발자국 더 나아가, 주요 플랫폼이 될 Meta나 Apple이 크리에이터 생태계를 잘 구축하는 것이 필요하겠다.
2번의 경우, 지금보다 가격이 더 내려가고, 성능이 올라가며, 1번과 맞물려 즐길 컨텐츠 거리가 많아진다면 접근성이 향상될 수 있다. 현재 Meta가 MR 디바이스의 접근성을 향상시키기 위해 노력 중이다. Quest 3s의 가격은 이제 300달러이다.(닌텐도 스위치, 에어팟 프로 수준) Meta가 지속적으로 저가 정책을 펼치면, 경쟁사인 Apple 역시 가격을 낮출 수 밖에 없다. 실제로 Apple은 25년 Vision Pro의 저가 모델인 Vision Air를 출시할 계획을 가지고 있다. 장기적으로 MR 디바이스의 가격이 내려가며 접근성이 올라갈 것은 이 두 회사의 방향성을 보면 명확히 알 수 있다. 여기에 추가적으로 Video AI 모델의 발전과 함께 3D 컨텐츠의 풍요가 도래하면 스마트폰은 적어도 집에서는 여가를 보내는 수단으로서의 자리를 MR 디바이스에게 빼앗길 것이다.
AI 2.0
마지막은 우리 인간들의 몫이다. Web이 그러했던 것처럼 AI 2.0 시대가 열려야 한다.
Web의 진화를 살펴보면 AI의 미래를 예측할 수 있다. Web 1.0 시대에 사용자들은 주어진 정보와 콘텐츠를 단순히 소비하는 데 그쳤다. 이 시기의 웹사이트들은 대부분 정적이었고, 사용자와의 상호작용은 제한적이었다. 기업이나 전문가들이 만든 콘텐츠를 일방적으로 제공하는 형태였다.
그러나 Web 2.0 시대에 들어서면서 큰 변화가 일어났다. 사용자들이 직접 정보를 생산하고 공유하기 시작했고, 이는 웹의 폭발적인 성장으로 이어졌다. 블로그, 위키, 소셜 미디어 플랫폼 등이 등장하면서 누구나 쉽게 콘텐츠를 만들고 공유할 수 있게 되었다. 사용자 생성 콘텐츠(UGC)의 급증, 협업의 증가, 그리고 웹 애플리케이션의 발전이 Web 2.0의 핵심이었다.
이러한 Web 2.0으로의 진화는 다음 세 가지 주요 요인에 의해 이루어졌다:
컴퓨터 비용/성능에서의 획기적 발전: 더 강력하고 저렴한 컴퓨터의 등장으로 더 많은 사람들이 웹에 접근할 수 있게 되었다.
멀티미디어 파일 속도 향상으로 인한 제작할 수 있는 콘텐츠의 범위 확대: 빠른 인터넷 속도로 비디오, 오디오 등 다양한 형태의 콘텐츠 공유가 가능해졌다.
사용자들의 웹 수용도 증가: 더 많은 사람들이 웹을 일상적으로 사용하게 되면서 참여와 공유의 문화가 형성되었다.
현재 AI 시장은 Web 1.0과 유사한 단계에 있다. 사용자들은 AI가 만들어낸 결과물을 수동적으로 소비할 뿐, AI를 활용해 자신만의 콘텐츠를 만드는 경우는 드물다. 그러나 AI도 Web과 유사한 진화 과정을 거칠 것으로 예상된다.
AI 2.0 시대는 다음 네 가지 요소에 의해 열릴 것이다:
0에 가까운 AI 모델 가격
인간에 가까운 길이의 Context Window3
멀티모달 생성 속도 및 성능 향상으로 인한 제작할 수 있는 콘텐츠의 범위 확대
사용자들의 AI 수용도 증가
이러한 변화로 인해 누구나 저렴한 가격으로 자신만의 이야기를 담아 콘텐츠를 제작할 수 있게 될 것이다. 표현의 범위도 다양해질 것이며(현재 텍스트, 이미지 위주의 표현에서 확장), 대중들이 점차 AI에 익숙해지고, 심지어 태어나면서부터 AI가 자연스러운 세대가 주류가 되면서 AI를 통해 일상의 문제를 해결하고, 무언가를 표현하고 이를 공유하는 것이 지극히 자연스러운 세상이 올 것이다.
이 때가 되어야 인간의 여가는 비로소 AI와 함께하는 모습일 것이다. 즉, AI와 함께하는 것이 대중들에게 익숙해지는 순간이 우리의 여가가 재정의되는 순간일 것이다.
Conclusion
AI는 PC와 유사한 기술 혁명이다 보니, 전세계 많은 혁신가들이 B2B에 집중해 제품을 만들고 있다. PC 혁명 때의 교훈을 돌아보면, 많은 가치들이 PC를 활용해 각 산업 영역마다 기업의 생산성을 높여주고, 비용을 줄여주는 부분에서 포착되었기 때문이다. 또 Consumer를 하지 않을 이유는 정말 많다. 기존의 플랫폼(유통망)이 지나치게 포화되어 있고, 일정 수준의 고객을 확보하기 위해 드는 유통/광고 비용이 지나치게 비싸졌다. 수익 모델 확보도 쉽지 않다. 많은 부분을 AI Model 회사에게 의존해야 하고, 아직 멀티 모달 AI의 가격은 비싸며, 앞서서 얘기한 광고/유통비 증가로 이익률이 적은 구조이다. 현 시점에서 Consumer AI를 한다는 것은 명백한 사양길이다.
하지만 10년 뒤를 생각해보자.
여전히 모바일이 우리의 유통망일까?
여전히 비디오 생성 AI의 가격이 비쌀까?
여전히 AI 인터페이스가 챗봇(with voice)일까?
여전히 우리가 숏폼/스트리밍을 시청하며 여가 시간을 보낼까?
이 질문들에 대한 나의 대답은 ‘아니요’이다. 우리는 비슷한 역사를 과거 10년전 20년전 겪어 왔다. 당연할 것 같았던 유통망/디바이스는 늘 변했고, 비싸보이던 기술은 늘 저렴해졌으며, 이로 인해 대중들의 잉여 시간은 늘 더 재미있고 새로운 도구가 책임져 왔다.
현 시점 Consumer AI는 과도기일 뿐이다. 마치 1900년 가전제품이 불편하고, 1995년 인터넷이 불편하고, LLM 이전의 B2B AI가 불편했던 것과 같다. 아직 AI로 내가 원하는 비디오를 만들기에는 불편한 점이 많다. 아직 AI가 만들어낸 컨텐츠는 어딘가 엉성하다. 하지만 가전제품이, 인터넷이, 그리고 현재 B2B에서의 AI가 그 실효성을 증명하고 있듯 Consumer AI도 10년 안에 그 진가를 발휘할 것이다.
길을 잃지 않으려면 멀리 봐야 한다. 멀리 볼 수 있으려면 발을 현실에 단단히 딛고 서 있어야 한다. 현재 Consumer AI 시장에서 빛이 보이지 않더라도 현 시점 고객들에게 제공할 수 있는 가치를 창출하며, 먼 미래를 만들어가고 있는 모든 빌더들에게 이 글을 바친다.
살아 있다는 것은 얼마나 황홀한가. 전에는 꿈도 꾸지 못했을 수많은 일들이 엄청난 가능성으로 우리 눈앞에 다가와 있다. 새로운 기업을 세우고 삶의 질을 끌어올리기 위해 의학 같은 과학을 발전시키고 친구나 아는 사람과 늘 연락을 가지는 것이 지금처럼 편리한 시절도 없었다. 소수의 전문기술자가 아니라 사회 전체가 방향을 이끌어갈 수 있도록 과학기술이 가져올 장점과 단점을 폭넓게 논의하는 것이 중요하다.이제 공은 독자의 손으로 넘어갔다. 이 책을 읽은 독자가 나의 낙관론을 조금이나마 받아들여 우리가 미래를 어떻게 건설해야 할 것인지를 놓고 함께 고민했으면 하는 것이 나의 바람이다.
-빌게이츠, 미래로 가는 길(1995)
Closing Comments
위 글에서 언급되는 예상들은 편협하고, 불확실하며 틀린 가능성이 높은 주장들이다. 그럼에도 모호하게 이야기하기보다 최대한 구체적으로 이야기하려고 한 것은, 구체적인 비전은 틀릴 가능성이 높아도 논의를 발전시킬 수 있는 여지가 많기 때문이다.
이 글에 반박해주셨으면 좋겠다. 근거를 들고 와서 이런 일은 일어나지 않을 것이고, 인공지능의 발전에도 변하지 않는 부분에 대해서 대화를 나눠보면 좋겠다.
필자(윤준선)는 긍정주의자, 낭만주의자이다. 반대로 편집자(조주현)는 현실주의자, 합리주의자이다. 더 많은 낭만주의자와 현실주의자가 싸워서, 같이 미래를 건설해나갔으면 하며 글을 마무리한다.
Pinpoint Research is a reader-supported publication. To receive new posts and support my work, consider becoming a free or paid subscriber.
“Consumer” has become something of a bad word in venture capital circles. - Rex Woodbury
What is AI Companion?
http://speechify.com/blog/what-is-an-ai-companion/#:~:text=These%20systems%20can%20understand%20context,other%20end%20of%20the%20chat.
What is Context Window?
https://www.techtarget.com/whatis/definition/context-window