AIB

뉴스

[매일경제]'챗GPT' 오픈AI 독점 구도 깨져 … 한국어 특화모델 서두를때

관리자 |
2023-04-20 11:13:20|
460

'챗GPT' 오픈AI 독점 구도 깨져 … 한국어 특화모델 서두를때

매경·KAIST 챗GPT 비즈니스 포럼
생성형 AI 2030년 130조원 시장
메타 초거대 AI '라마' 등 출시
복수 언어모델시대 본격 열려
한국어 차별화 서비스 개발로
비영어권 시장부터 공략 나서야

매일경제신문사와 KAIST가 공동 주최한 '챗GPT 비즈니스 포럼'이 19일 매경미디어그룹 본사에서 열린 가운데 김광섭 카카오브레인 최고기술책임자(CTO)가 챗GPT 미래에 대해 강연을 하고 있다. 이충우 기자

"챗GPT보다 가벼운 여러 대규모언어모델(LLM)이 출현해 오픈AI 독점 구도에 균열을 내고 있다. 한국어 특화 LLM으로 글로벌 경쟁에 대응하면서 세부 서비스(튜닝) 모델에서 차별성을 확보하는 전략이 중요하다."

19일 매일경제신문사와 KAIST가 서울 중구 매경미디어센터에서 마련한 '챗GPT 비즈니스 포럼'에서 국내 인공지능(AI) 분야를 이끄는 민·관·학 전문가들이 참여해 현재의 생성형 AI 시장 상황을 진단했다. 전 세계 생성형 AI 시장규모가 2030년이 되면 1093억달러(약 130조원·글로벌 시장조사업체 그랜드뷰리서치)를 돌파할 것으로 전망되는 가운데, 국내 전문가들은 '복수 언어모델 시대'를 맞이해 한국어 특화 AI를 하루빨리 확산시키고 시장 생태계에서 중요한 AI 반도체 분야를 키워야 한다고 입을 모았다.

이날 연설자로 나선 김지원 SK텔레콤 멀티모달AI 담당은 "그동안 오픈AI사가 챗GPT 소스를 공개하지 않아 생성형 AI 독점 논란이 있었는데, 메타(페이스북)가 지난 2월 경량화 모델인 라마(LLaMA)를 오픈소스로 배포하며 학계에서 상대적으로 용량이 가벼운 라마로 대거 옮겨가고 있다"며 "라마를 기반으로 알파카(스탠퍼드대), 비쿠나(UC버클리 등 연합) 등 챗GPT와 비슷한 기능을 하는 다양한 생성형 AI 모델이 생겨나고 있다"고 현재 상황을 진단했다.

메타가 지난 2월 공개한 LLM 라마는 챗GPT의 70~80% 성능을 내는 동시에 최대 용량이 65B로 챗GPT 대비 3분의 1가량 적다. 아울러 계속 경량화 버전이 나오며 라마 7B 버전까지 내려온 상황이다. 산술적으로 계산하면 챗GPT 대비 용량이 30분의 1에 불과하다. 이처럼 용량이 훨씬 가벼운 라마가 오픈소스로 나오면서 그래픽처리장치(GPU) 등 컴퓨터 자원이 대기업에 비해 현저히 부족한 학계·연구소·개인이 라마를 기반으로 다양한 '미니GPT'를 내놓는 등 LLM 저변이 크게 확대되고 있다.

복수 구도로 생성형 AI 시장 생태계가 확장하면서 AI 반도체에 대한 시장 관심도 커지고 있다. AI 반도체는 AI 특화 칩을 말한다. 오픈AI의 챗GPT는 엔비디아 GPU A100을 활용했는데, 1대당 1500만원의 고가이면서 동시에 소비전력이 6.5㎾(6500W)에 달한다. 업계에서는 오픈AI가 챗GPT를 운영하는 데 쓰는 전기료만 한 해 6000억원(한 달 500억원·월간 사용자 수 1억명 기준)으로 추산하고 있다.

생성형 AI 시장이 커지기 위해선 이 같은 운영비를 획기적으로 낮춰야 하는데 AI 반도체 칩을 사용하면 전기료를 최대 10분의 1까지 절감할 수 있다. 이 분야에서는 국내 AI 스타트업 리벨리온, 퓨리오사AI 등이 두각을 나타내고 있다. 특히 리벨리온 AI 반도체 아톰은 반도체 칩 성능 측정에서 권위 있는 대회인 글로벌벤치마크에서 엔비디아·퀄컴에 비해 1.4~3배 앞서는 성능을 보여 최근 화제를 일으켰다.

이날 포럼에서 오진욱 리벨리온 최고기술책임자(CTO)는 "생성형 AI 시장 자체가 커지면서 좋은 컴퓨팅 파워에 대한 수요가 높아지고 있다"며 "이 때문에 도처에서 저전력 하드웨어인 AI 반도체에 대한 문의가 많아지고 있다"고 밝혔다. 여현덕 KAIST G-School 원장은 "적은 에너지, 빠른 속도, 간편한 모바일 등에 적용되는 AI 반도체 모델이 각광받을 것"이라며 "아톰 등 AI 반도체가 초개인화 모델로 고객 경험을 향상시키는 역할을 할 것"이라고 강조했다.

한국어 특화 AI 모델을 만들어야 한다는 의견도 주목을 받았다. 김광섭 카카오브레인 CTO는 "LLM은 기초모델과 튜닝모델을 구분해야 하는데 기초모델은 대규모 인프라와 데이터 자본이 필요한 분야여서 글로벌 수준에서 최고 수준의 경쟁력을 확보하기 힘든 상황"이라며 "기초모델은 패스트폴로어로 따라가면서, 우리는 기초모델에 얹어지는 서비스인 튜닝모델에 더욱 집중하고 차별화해야 한다"고 말했다. 하정우 네이버클라우드 AI이노베이션 센터장은 "오픈AI가 API 가격을 올리고 있는 상황에서 한국어로 GPT-4를 쓰고 있는 이용자는 영어 대비 3배가량 비싸게 AI를 사용하고 있다"며 "한국의 법이나 문화에 맞는 내용을 더 정확하고 적은 비용으로 구사한다는 점에서도 한국어 특화 LLM은 필요하다"고 강조했다. 이어 그는 "LLM 기술은 인터넷망, 전기망과 같은 기반 인프라 기술"이라며 "해외 업체에만 의존하면 국내 사용자의 데이터가 해외 DB(데이터베이스)로 넘어갈 수밖에 없는데 이렇게 되면 종속되는 효과가 발생한다. 지속가능성과 나라 전체의 경쟁력 관점에서 보면 국내 기업이 경쟁력 있게 한국어 특화 LLM 모델을 만들어야 한다"고 덧붙였다. SK텔레콤은 지난해 5월 출시한 성장형 AI 서비스 '에이닷(A.)' 서비스를 LLM 등을 통해 고도화할 계획이다. 네이버는 전문 분야에 특화된 하이퍼클로바X를 오는 7월 내놓을 예정이다. 카카오브레인은 상반기 내 300억개 파라미터 규모의 언어모델을 공개하는 등 한국형 언어모델인 KoGPT를 보다 강력하게 개발한다.

향후 챗GPT 기능이 탑재된 사회관계망서비스(SNS)가 나올 것이란 전망도 나왔다. 기존 컴퓨터의 발전 경로를 보면 텍스트에서 이미지, 그리고 이커머스·SNS로 사용처가 확대됐다. 김지원 SK텔레콤 담당은 "현재 GPT를 통해 텍스트·이미지가 가능한 상황이어서 그다음엔 AI와 연계된 SNS가 유행하지 않을까 생각한다"고 밝혔다.

이날 엄열 과학기술정보통신부 인공지능기반정책관(국장)은 챗GPT 시장 생태계와 관련해 "정부는 AI 디지털 주권을 지키기 위해 여러 노력을 하겠다"고 강조했다. 저작권 문제에 대해 그는 "AI 학습 시 저작물을 활용하는 문제, 그리고 AI가 만들어낸 창작물의 저작권을 인정하는 문제가 있는데 현재의 저작권법은 무겁다(모두 다 막혀 있다)"며 "문화체육관광부, 행정안전부 등 관계 부처와 협의해 법이 안 된다고 한다면 규제샌드박스를 통해 일단 허용하는 안을 검토할 것"이라고 강조했다. 이와 관련해 정부는 인공지능 관련 법제 정비단을 발족한 상황이다.

김대기 기자(daekey1@mk.co.kr), 나현준 기자(rhj7779@mk.co.kr), 우수민 기자(rsvp@mk.co.kr)

기자 프로필

첨부파일