N3N CLOUD - IDC Service CHEETAH
뉴스게시판 Cheetah 서비스 안내와 다양한 행사 소식을 전해드립니다.

[KDI경제정보센터] 인공지능 전문가 좌담 "인공지능 시대, 어떻게 활용할 것인가"

본문

"인공지능 시대, 어떻게 활용할 것인가"


인공지능 두 번째 전문가 좌담은 ‘인공지능 시대, 어떻게 활용할 것인가’라는 주제로 진행되었다. 산업 분야 전문가들이 생각하는 AI의 본질부터 데이터 수집과 활용 방법, 일자리 대체 전망, AI 인력 수요까지 다양한 이야기를 다루었다. 특히, 많은 사람들이 궁금해 하는 일자리 문제와 관련해선 이전의 신기술과 마찬가지로 새로운 직업이 창출될 것으로 보는 예상과 기존의 경로와는 다를 것이라는 우려가 공존했다. 아울러 AI를 논할 때 빠지지 않는 데이터의 중요성과 규제 이슈에 대한 현장 관계자들의 허심탄회한 생각도 들어봤다. 클라우드 규제 완화를 비롯해 기술 오픈에 대한 가치를 인정해주는 사회적 분위기 조성의 중요성과 AI 협업문화를 저해하는 연구소·학교의 제도적 요인 개선에 힘써야 한다는 쓴소리도 마다하지 않았다.
생생한 현장의 목소리를 담은 산업계 전문가 좌담, 궁금하다면 지금 바로 클릭 click!



▶ 일시: 2020년 11월 2일 16:00~17:30
▶ 장소: 컨퍼런스하우스 달개비(서울시) 
▶ 참석자(가나다순)
   김동민 제이엘케이 대표
   서중해 KDI 경제정보센터 소장(좌장)
   유용균 한국원자력연구원 미래전략본부 지능형컴퓨팅연구실장
   이재훈 딥서치 VP of Product Development
   주철휘 엔쓰리엔클라우드 인공지능연구소장



#1. 인공지능의 본질: 기계가 생각할 수 있는가?

· 서중해: 오늘은 ‘인공지능 시대, 어떻게 활용할 것인가’를 주제로 산업계의 의견을 듣고자 자리를 마련하였습니다. 현장에서 AI를 활용해 경제적인 성과와 가치를 창출하시는 네 분을 모셨습니다. 본격적으로 시작하기에 앞서 먼저 AI에 대한 근본적인 질문을 드리고 싶습니다. 튜링 머신을 구상한 수학자이자 컴퓨터 과학자 앨런 튜링
(Alan Turing)이 1950년에 발표한 논문「계산 기계와 지성(Computing Machinery and Intelligence)」에서는 ‘기계가 생각할 수 있는가?(Can Machines Think?)’라는 질문을 제기합니다. 관련 자료들을 살펴보니 극단적으로 의견이 대립하더군요. 이와 관련해 현업에서 AI를 활용하는 네 분의 생각은 어떤지 자유롭게 말씀해 주셨으면 좋겠습니다.

· 김동민: ‘생각’에 대한 개념 확립이 선행되어야 할 것 같습니다. 만약 생각을 새로운 것을 만들어 낼 수 있는 능력이라고 정의한다면 현재 AI는 충분히 그러한 방향으로 나아가고 있다고 봅니다. 코로나19 확산 이후로 AI가 데이터 조합으로 신약을 개발할 수 있는가를 상당히 많이 연구했습니다. 이를 통해 느낀 점은 사람이 학습이나 기억을 기반으로 새로운 것을 생각해 내는 것처럼 AI도 데이터를 활용해 새로운 물질을 만들어 낸다는 것입니다. 당연히 검증 절차는 필요합니다. 하지만 우리는 유독 기계에만 엄격한 잣대를 가지고 평가하는 경향이 있습니다. 사람의 아이디어도 검증을 거쳐야만 실현되는데 AI가 판단을 잘못하거나 예측이 빗나가면 사회적으로 파장이 커요. 무한정 생산되는 데이터를 조합하여 새로운 것을 만들어 내는 작업은 머신러닝이 인간보다 훨씬 빠릅니다. 이 점을 인간 대신 생각하는 기능 내지는 영역으로 볼 수 있지 않을까요. 기계의 원리적인 부분에 대해서 이해를 충분히 거친다면 지금보다 더욱 잘 활용할 수 있을 것입니다.

"데이터를 조합해 새로운 것을 만들어내는 작업은 머신러닝이 인간보다 훨씬 뛰어나"


· 주철휘: AI가 인간 수준의 감정과 상식을 기반으로 의사결정을 하는 단계는 현재로서는 어렵다고 생각합니다. 미래학자 레이 커즈와일(Ray Kurzweil)은 2045년에 특이점(singularity)이 올 것으로 예측했어요. 예를 들면, 기계가 인간처럼 나무의 밑동을 보고 어떻게 걸터앉을지를 즉흥적으로 생각할 수 있는 수준을 말하는데 이에 도달하려면 데이터 없이도 추론이 가능해야 합니다. 그런데 현재는 적합한 데이터가 주어져야만 양질의 예측이 가능한 수준이지요. 최근 AI 언어처리 알고리즘인 ‘GPT-3(Generative Pre-trained Transformer 3)’가 많이 회자되는 이유도 딥러닝 3대 석학 중 한 명인 얀 르쿤(Yann LeCun)이 회의적인 입장을 표명했기 때문입니다. 얀 르쿤에 따르면, 언어 모델을 확장해 지능적인 기계를 만들려는 것은 프로펠러 비행기로 달에 가려는 것과 같다고 합니다. 프로펠러 비행기로 고도비행 기록을 깰 수는 있지만, 달에 가기 위해선 완전히 다른 접근법이 필요합니다. GPT-3모델이 5,000억 개의 단어(token)를 학습했다고는 하지만 아직까지는 한계가 있는 것입니다.

 "현재 수준으로는 AI가 인간처럼 생각하고 의사결정 하는 단계는 어려울 것"
 
※ 자세히 들여다보기 1

□ GPT-3(Generative Pre-trained Transformer 3)
    · 2019년 6월 초 오픈AI(Open AI)*에서 개발한, 인간처럼 텍스트를 만들어 낼 수 있는 고급
     언어처리 AI 알고리즘을 일컬음

      * 일론 머스크가 투자한 비영리 AI 연구단체로 사람들이 사용하기에 폭넓고 안전한 AI
        개발을 목표로 설립된 연구소
    · 프랑스 헬스케어 기업 나블라 테크놀로지(Nabla Technologies)가 GPT-3를 의료분야 
     상담에 적용한 실험에서 부적절한 대응으로 논란이 제기

     - 병원 예약과 비용처럼 간단한 응답은 문제가 없지만, 의학적인 사고로 판단해야 하는
       상담에서는 모의 환자에게 자살을 권유하기도 함
     - AI 알고리즘이 일관적인 문장을 형성하는 능력과 실제 유용성 간에는 큰 차이가 존재함을 시사
 


· 이재훈: 김 대표 말씀처럼 ‘생각’을 어떻게 정의할 것이냐가 핵심 같습니다. ‘생각’을 목적을 이루기 위해 과정을 찾아가는 것으로 폭넓게 본다면, 사람이 학습할 데이터를 선정하고 일정 부분 지시에 의해 작동한다고 하더라도 AI가 ‘생각’한다고 볼 수 있습니다. 그런데 기계가 스스로 처음부터 어떤 데이터를 어떻게 활용할지를 결정하는 것을 ‘생각’으로 본다면 그건 현재 기술로서는 한계가 있기 때문에 ‘생각’한다고 할 수 없지요. 결국은 ‘생각’의 정의를 어떻게 내릴 것이냐에 따라서 판단이 달라질 수 있습니다.

"‘생각’의 정의를 어떻게 내릴 것이냐에 따라 판단 달라져"


· 유용균: 역사를 보면 AI의 정의 자체도 계속해서 변화해 왔습니다. 초창기 과학자들은 AI를 ‘인간처럼 생각하는 기계’로 여기고 인간과 같은 수준의 기계를 구현한다는 일념 하나로 연구에 매진했는데 생각보다 성과가 나오지 않았습니다. 그러자 ‘합리적으로 생각하는 기계’로 단계를 낮추었고, 현실적으로 목표를 수정하여 ‘합리적으로 행동하는 기계’로 정의한 것입니다. 그렇기 때문에 현재 학문적으로 보는 AI와 외부에서 생각하는 AI에 간극이 있는 셈입니다. 마틴 포드(Martin Ford)의 「AI 마인드-세계적인 AI 개발자들이 알려주는 진실」에 의하면 AI 학자들은 인간과 같은 지능을 구현하는 시기를 2100년으로 예견했습니다. 일반 사람들이 생각하는 인간과 같은 AI는 아직까지 요원한 것입니다.

"역사를 보면 AI의 정의는 현실적으로 변화, 인간과 같은 AI는 아직 먼 미래"
 
※ 자세히 들여다보기 1

□ GPT-3(Geerative Pre-trained Transformer 3)
    · 2019년 6월 초 오픈AI(Open AI)*에서 개발한, 인간처럼 텍스트를 만들어 낼 수 있는 고급
     언어처리 AI 알고리즘을 일컬음

      * 일론 머스크가 투자한 비영리 AI 연구단체로 사람들이 사용하기에 폭넓고 안전한 AI
        개발을 목표로 설립된 연구소
    · 프랑스 헬스케어 기업 나블라 테크놀로지(Navla Technologies)가 GPT-3를 의료분야 
     상담에 적용한 실험에서 부적절한 대응으로 논란이 제기

     - 병원 예약과 비용처럼 간단한 응답은 문제가 없지만, 의학적인 사고로 판단해야 하는
       상담에서는 모의 환자에게 자살을 권유하기도 함
     - AI 알고리즘이 일관적인 문장을 형성하는 능력과 실제 유용성 간에는 큰 차이가 존재함을 시사※ 자세히 들여다보기 2

□ 4가지 접근 방식에 따른 인공지능의 개념
    
① 인간처럼 생각하는 기계
(Thinking Humanly)
② 합리적으로 생각하는 기계
(Thinking Rationally)
"컴퓨터를 생각하게 만드는 새롭고 흥미로운 노력... 말그대로 '마음을 가진 기계'(Haugeland, 1985)"

"의사결정 및 문제해결과 같은 활동, 즉 인간의 사고와 관련된 활동의 자동화(Bellman, 1978)"
"계산적 모델 활용을 통한 정신적 능력에 대한 연구(Charniak and McDermott, 1985)"

"지각, 추론 및 행동을 가능하게 하는 계산에 대한 연구(Winston, 1992)"
③ 인간처럼 행동하는 기계
(Acting Humanly)
④ 합리적으로 행동하는 기계
(Acting Rationally)
"인간 지능이 필요한 기능을 수행하는 기계를 창조하는 기술(Kurzweil, 1990)"

"인간이 더 잘하는 것을 어떻게 컴퓨터가 수행하게 만들지를 연구하는 것(Rich and Knight, 1991)"
"계산적 지능은 지능적 에이전트를 설계(design)하는 것에 대한 연구(Pool et al., 1998)"

"AI는 인공물에서의 지능적 행동과 관련(Nilsson, 1998)"
 출처: Stuart Russell & Peter Norvig(2009), p.2
 



#2. 인공지능 기술과 활동 영역: 국내 AI 적용 사례

· 서중해: AI 기술에 대한 산업계의 생각과 입장은 학계와는 다소 상이할 것으로 생각됩니다. 현재 진행하고 있는 사업을 말씀해 주시고 이와 함께 AI 적용 분야에 대한 소개를 곁들여 주시면 좋을 것 같습니다.

· 주철휘: 엔쓰리엔클라우드
(N3NCLOUD)는 멀티클라우드와 자동 머신러닝 플랫폼을 개발하는 기업입니다. 개념을 짚고 넘어가자면 멀티클라우드는 2개 이상의 프라이빗(private) 또는 퍼블릭(public) 클라우드 서비스를 단일 환경처럼 관리할 수 있는 기술을 의미합니다. 자동 머신러닝이란 AutoML(Automated Machine Learning)이라고 하며, 데이터 수집과 정제, 모델 구축과 훈련 및 평가, 서비스 제공까지의 단계별(end-to-end) 파이프라인을 자동화하는 것을 말합니다. 기업의 입장에서 모델을 만드는 궁극적인 목적은 제품과 서비스를 창출하기 위함입니다. 현재 대부분이 모델 개발 쪽에 많은 노력들을 기울이고 있습니다. 하지만 시간이 지나면 결국 소비자에게 전달되는 과정에서 빅데이터 저장·관리 성능이 중요해질 것입니다. 실제로 사진을 보고 고양이라고 판별하는 그 자체를 모델이라고 했을 때, 모델과 훈련에 소요되는 시간은 각각 5%~10%, 20%이고, 나머지 대부분의 시간은 데이터의 수집과 정제, 성능평가에 소요됩니다. 최근 ‘프로젝트는 많으나 프로덕트는 없다.’는 말이 회자되곤 합니다. 즉, 많은 기업이 AI에 뛰어들고 있지만 실질적으로 상품이나 서비스를 제공하고 수익을 창출하는 확실한 비즈니스 모델이 아직까지는 나오지 않고 있는 상황입니다.

"단일 환경처럼 관리하는 멀티클라우드 및 단계별 파이프라인 자동화하는 머신러닝 개발"
 
<표> 공유 범위와 서비스 운용형태에 따른 클라우드 분류
프라이빗 클라우드· 기업 및 기관 내부에 클라우드 서비스 환경을 구성하여 내부자에게
  제한적으로 서비스를 제공하는 형태
퍼블릭 클라우드· 불특정 다수를 대상으로 하는 서비스로 여러 서비스 사용자가
  이용하는 형태
하이브리드 클라우드· 프라이빗 클라우드와 퍼블릭 클라우드의 결합 형태(다른 유형)
멀티 클라우드· 2개 이상의 퍼블릭 클라우드 또는 프라이빗 클라우드가 결합(동일유형)
출처: ETRI(2019) 재구성

· 이재훈: 딥서치(DeepSearch)는 AI뿐만 아니라 경제, 금융 전반의 데이터를 다루는 비즈니스 데이터 분석 플랫폼 기업입니다. 우선 저희는 증권사에 기술과 인프라를 지원해 AI가 자동으로 생성하는 증권분석 리포트 툴을 개발한 바 있습니다. 또, 증권거래 앱에서 보는 뉴스도 저희 측에서 제공하고 있다고 보시면 되는데 뉴스 자체가 비정형데이터라 서버로 구축하기는 어렵기 때문입니다. 아울러 대기업에서 자회사들을 모니터링하는 툴에도 솔루션을 공급하는 등 비즈니스에 필요한 전반적인 데이터 분석을 제공하고 있습니다. 그러다보니 증권사에서 점차 일반기업으로 주 고객층이 확대되고 있고, 이러한 기업들의 요구에 맞춰 데이터도 범위가 확장되고 있는 상황입니다. 한편 저희 서비스 중에는 20년간의 뉴스데이터 약 9,500만 건에 기반한 머신러닝 학습서비스도 있습니다. 기사에서 언급된 엔티티(entity)로서 기업이나 사람, 브랜드를 추출하고, 단어의 긍·부정도 분석이 가능합니다. 물론 고객 측의 기준은 다를 수 있기 때문에 고객사에서 훈련 데이터셋(dataset; 데이터 집합체)을 제공하면 저희 측에서 수집한 데이터로 학습을 시킨 다음에 고객사의 배포 시스템을 적용해 API(Application Programming Interface; 프로그램들이 서로 상호작용하는 것을 도와주는 매개체)로 제공하는 작업을 수행하고 있습니다.
"금융 데이터 분석에서 AI 솔루션 제공까지 기업 요구에 맞춰 사업 범위 확대"
 
※ 자세히 들여다보기 3

□ Application Programming Interface
 - 소프트웨어 사이의 데이터 통신을 위한 인터페이스를 총칭
 - 서버와 클라이언트가 네트워크를 통해 요청과 결과값을 주고 받거나 하나의 로컬 컴퓨터 안에서
   응용 프로그램이 운영체제에게 시스템 자원을 요청하기 위한 방법

                                
 


· 서중해: 제이엘케이(JLK)는 2019년 AI 분야에서 코스닥 시장에 첫 상장한 경우라고 들었습니다. 김동민 대표께서 그동안의 운영 과정과 성과 등을 말씀해 주시면 좋을 것 같습니다.

· 김동민: 지난 2019년 12월 의료 AI 업체로서는 처음으로 코스닥 기술특례 상장에 성공했습니다. 데이터, 알고리즘, 제품화 부분에서 차별화된 성과를 거둔 덕분이라고 생각합니다. 사실 저희는 알파고가 등장하기 전인 2015년부터 의료 AI를 시작했습니다. 데이터에 대한 인식이 전반적으로 낮은 시기여서 어려움이 있을 것이라 생각했지만 운이 좋게도 한국에서 해답을 찾을 수 있었습니다. 한국이 PACS
(병원 내 영상을 모아두는 시스템) 보급률 97%로 전 세계에서 1위였던 만큼 전산화가 잘 되어 있었기 때문입니다. 병원 내부에 상당히 많은 영상데이터가 존재했고, EMR(전자의무기록) 등 의료 분야의 IT 인프라가 잘 마련돼 있어서 데이터 자체가 풍부했습니다. 이렇듯 기술적인 측면에서 의료적 지식을 녹일 수 있는 환경이 충분히 구축되어 있었기 때문에 2016년 국내 처음으로 의료기기 3등급 허가를 위한 여러 임상실험을 진행할 수 있었습니다. 특히, 뇌경색에 대한 연구를 진행할 때는 ‘한국인 뇌MR영상 데이터센터’에서 10년 동안 수집한 14,000명 환자의 140만 장 MR 영상 데이터를 활용했습니다. 각 장마다 주석(annotation)이 달린 고품질의 데이터를 기반으로 전 세계적으로 선도해서 제품을 출시할 수 있었습니다.















"한국의 병원 의료영상 데이터와 IT 인프라를 기반으로 국내 최초 임상실험 진행"
 

· 서중해: 사업 아이디어를 어디에서 착안한 것인지 궁금합니다.

· 김동민: 2014년 즈음 제가 일본에 있었을 때 한 전시회에서 충격을 받은 적이 있습니다. 사실 일본에서는 2012년부터 영상에 있어선 딥러닝 툴로 어느 정도 성과를 낼 수 있다는 게 점차 기정사실화되어 가던 중이었습니다. 때마침 그 전시회에서도 로봇이 박스 안에 담겨있는 나사들을 하나씩 집어 세우는 과정을 시연하더군요. 처음에는 실패했지만 학습을 통해 점점 성공해 나가는 것을 현장에서 목격하고 머신러닝에 대한 인식이 많이 바뀌었습니다. 그 후부터 머신러닝과 딥러닝 관련 툴들을 찾아보다가 의료 사이언스 분야의 여러 MR 영상에서 데이터를 얻게 되면서 본격적으로 사업을 시작하게 되었습니다.

"로봇 시연 관람 후 머신러닝 사업 가능성 직감"


· 서중해: 사실 AI 그 자체도 중요하지만 AI가 여러 산업으로 파급돼서 활용성과 효율성이 높아지면 국민경제 전체로 큰 영향을 미치게 됩니다. 그래서 경제학자들은 AI가 일반목적기술(GPT)인지 여부를 판단하곤 하는데, GPT의 잠재력을 실현할 수 있는 정책이 앞으로의 과제입니다. 한국원자력연구원은 원자력 기술 개발과 시설 운영 등 국가적으로 중요한 업무를 수행하고 있습니다. 또한 유용균 실장께서는 ‘AI프렌즈’라는 커뮤니티 활동도 한다고 들었습니다. 원자력연구원에서는 AI를 어떻게 활용하는지 그리고 운영진으로 참여하고 있는 AI프렌즈 커뮤니티는 어떤 곳인지 말씀해 주시면 좋겠습니다.

"AI가 GPT로서 잠재력을 넓히기 위한 정책 방향이 향후 과제"


· 유용균: 한국원자력연구원의 지능형컴퓨팅연구실은 연구소의 데이터 분석을 전담하는 조직으로 올해 창설되었습니다. 주로 원자로의 안전 진단 및 시뮬레이션 가속화를 위한 AI 연구를 수행하고 있는데요. 기계의 이상 여부를 점검하기 위해서 과거에는 사람이 직접 신호파형을 보고 분석했다면 현재는 AI를 활용해 정확성을 높이고 인적 오류를 낮추는 것이 가능해졌습니다. 뿐만 아니라 원자력 발전소의 핵반응, 에너지 형성 등 복잡한 물리현상에 대한 시뮬레이션을 가속화하는데도 AI가 큰 기여를 하고 있습니다.
 다음으로 AI프렌즈는 AI 적용에 관심 있는 출연연구소, 기업, 개인으로 구성된 커뮤니티입니다. AI 분야가 빠르게 발전하는 원동력은 높은 개방성과 공유 문화라고 생각합니다. 이러한 문화를 연구소에 도입하여 부서/연구소 사이 소통 장벽을 허물어 보자는 것이 초기 취지였습니다. AI프렌즈는 AI 이론 자체를 깊게 연구하는 것 보다는 AI를 어떻게 하면 잘 응용할 수 있는지에 관심이 많습니다.
 AI가 GPT라는 점에는 100% 동의하는 입장입니다. 어떤 공학적 문제를 풀기 위해서 모든 수단을 동원하는 것처럼 그러한 도구 중의 하나로 AI를 활용할 수 있다고 생각합니다.

"원자로 안전 진단 및 시뮬레이션 등에 AI 연구 수행,
AI프렌즈에서는 AI 활용·응용 방법 모색"


· 서중해: AI 기술 개발에 힘쓰는 분야가 있다면 이를 응용하여 새로운 것을 만들어 내는 쪽도 중요하다고 생각합니다. 무엇보다 출연연구기관에 계신 분들께서 AI의 활용도를 높이고 사람 간 협력 문화를 형성하고자 만든 커뮤니티는 의미 있고 좋은 사례인 것 같습니다.


#3. 이슈점검①: AI와 데이터

· 서중해: 올해 KDI에서 관심을 가지고 있는 분야 중 하나는 항상 AI와 함께 논의되곤 하는‘데이터’입니다. 김동민 대표께서는 출발선상에서 좋은 데이터를 얻을 수 있었기에 훨씬 더 이점이 있었다고 이해가 됩니다. 그런데 데이터를 구할 수 없거나 데이터는 있는데 활용을 하지 못하는 경우가 상당수 존재하는 것도 사실입니다. 데이터를 어떻게 수집하고 AI에 접목할지 그리고 궁극적으로 비즈니스 가치를 어떻게 창출할지 등을 짚어주면 좋겠습니다.

"데이터 수집과 활용 방법은 항상 AI와 함께 논의되는 중요한 문제"


· 주철휘: 제가 이전에 보건복지부 산하 AI 신약개발지원센터의 부센터장을 맡으면서 겪은 바는 김 대표와 조금 다릅니다. 제약 쪽은 디지털화된 데이터를 수집하는 데 다소 어려움이 있었습니다. 여기에서 말하는 데이터란 장부에 수기로 작성하는 것이 아니라 컴퓨터에 입력 가능한 디지털 형태의 고품질 데이터를 의미합니다. 제이엘케이의 경우, 병원이라는 우리나라 특수상황 덕분에 좋은 성과를 거두었던 것 같습니다. 그러나 일반적으로는 인프라를 구축하고 난 이후에 데이터 문제와 맞닥뜨리는 경우를 많이 보게 됩니다. AI를 기업이나 산업에 적용하려면 AI를 활용했을 때 효과가 있는 분야와 없는 분야를 구분하는 것이 먼저입니다. 그런데 현재는 AI 기술이 급부상하니까 모든 부분에 적용하려는 경향이 있는 것 같습니다. 쉽게 특징을 추출할 수 있는 작업은 굳이 AI를 활용할 필요가 없습니다.

"AI 적용 시 효과가 있는 분야와 없는 분야 구분이 우선"


· 서중해: 그렇다면 AI를 적용해 효과를 거두려면 어떤 노력들이 필요할까요? 

· 주철휘: 제가 IBM에서 왓슨
(Watson; 자연어 형식으로 된 질문들에 답할 수 있는 AI 컴퓨터 시스템으로 최근에는 의료 영역으로 확장해 의료 이미지 분석 등에 사용) 프로젝트를 수행하면서 느낀 것은 AI는 인터넷이나 모바일과 달리 데이터에 기반한 전환(data-driven transformation)을 가져온다는 점입니다. 즉, 데이터가 산업의 근간이 되어야 합니다. 어떤 데이터가 나한테 주어질 수 있고, 어떤 데이터를 먼저 확보해야 하는가에 대한 생각이 선행되어야 합니다. 정부 또는 일부 기업에서 무작정 달려들었다가 데이터를 준비하는 데 시간을 소비하는 경우를 많이 봤습니다. 앞으로는 데이터를 기반으로 AI를 훈련시키고, 결과에서 나오는 통찰력으로 산업 경쟁력을 제고해야 합니다. 이러한 접근 방식을 취하고 안목을 키우는 것이 무엇보다 중요합니다.

"데이터를 산업의 근간으로 두고 AI에 접근하는 안목 키워야"


· 서중해: 안목을 얻으려면 결국 경험이 축적되는 과정이 필요하다는 말씀 같습니다. 제이엘케이의 경우, 이전과 반대로 지금은 데이터와 관련해 어려운 점이 없는 것인가요?

· 김동민: 물론 초기에 어느 정도 성과는 이뤘지만 본격적으로 사업화를 시작하면서 첫 번째로 부딪힌 것은 서비스였습니다. 현장에서 필요로 하는 것과 저희가 구현해야 되는 기술의 차이를 많이 느꼈습니다. 주요 고객층인 의사, 교수 등 의료계에서 요구하는 기술 수준이 높아졌기 때문인데요. 예를 들어 순간적인 뇌 분석을 통해 현재 상태를 진단하는 기술에서 한발 더 나아가 3~5년 후 경과에 대한 예측을 바라기 시작했습니다. 이에 부응하는 AI를 개발하려면 전향적으로 수집되는 데이터나 심지어 과거 데이터와 융·복합된 데이터가 필요합니다. 환자가 과거 어떤 질병을 앓았는지부터 시작해 의료 영상을 찍고 3~5년 뒤 경과는 어떠한지를 종합적으로 융합해야 되는 거죠. 데이터 구성 자체의 차원이 지금과는 완전히 달라집니다. 그리고 이를 분석하기 위한 다른 차원의 알고리즘 구현이 필요합니다.

"주 고객층이 원하는 기술 수준 높아져, 지금과는 다른 차원의 데이터와 알고리즘 필요"


· 이재훈: 데이터 수집과 학습, 배포 등 일련의 과정이 있지만 산업에서는 학습에 필요한 데이터 수집부터가 어렵습니다. 물론 금융권은 과거부터 주식, 경제, GDP, 환율, 유가 등의 정형 데이터를 많이 사용해 왔고, 머신러닝이 등장하면서 뉴스나 공시 등 비정형 데이터가 추가됐지만 수집 장벽은 높지 않은 편입니다. 하지만 비정형 데이터 특히, 공시 데이터가 갖고 있는 가장 큰 문제는 느린 것(time lag)입니다. 올해 공시는 내년이 되어야 나오는데 이미 상당한 시차가 발생합니다. 두 번째는 모두에게 공개된 데이터라는 점입니다. 데이터 분석으로 이점을 얻기 위해서는 조금 더 실시간에 가깝고 세분화된 데이터, 남들이 없는 데이터 확보가 필수적입니다. 하지만 삼성전자나 LG전자 등의 경우, 기업의 전체 매출은 있지만 스마트폰, 냉장고 등의 디테일한 분야별 매출은 일반적으로 공개되지도 않을뿐더러 거래도 어렵습니다.

"차별화된 데이터 확보가 필수적이나 공개·거래 안 돼 수집 어려워"


· 서중해: 원자력연구원은 데이터 생성기관이기 때문에 이와 관련한 문제는 없을 것으로 생각됩니다. 그래서 보다 폭넓게 AI를 적용하면서 겪은 문제 혹은 AI 커뮤니티에서 논의된