인공 지능

AI 사물 인식, 세계 최고 수준 기술 확보

마도러스 2020. 2. 5. 22:34



AI 사물 인식, 세계 최고 기술 확보

 

T브레인, VQA 챌린지서 2, 1위 페이스북과 0.7%P 불과

 

SK텔레콤 T브레인 임수현 에반젤리스트는 “AI 핵심 기술인 VQA (시각적 질의 응답) 분야에서 SK텔레콤이 세계 최고 수준 기술력을 확보했다. 사회 공헌 활동 등 다양한 분야에 적용할 국산 원천 기술 확보에 성공했다고 말했다. 그는 T브레인이 세계적 AI 학회 'CVPR'2018년 미국에서 개최한 VQA 챌린지에서 쟁쟁한 경쟁자를 누르고, 페이스북에 이어 2위를 차지했다고 소개했다. 알고리즘 정확도 71.69%를 기록했다. 페이스북에 불과 0.7%포인트 뒤진 아쉬운 2위였다.

 

T브레인은 2018년 또 다른 세계적 권위의 AI 학회인 'ECCV' VizWiz 챌린지에서도 페이스북에 이어 2위를 차지했다. VQA (시각적 질의 응답)는 사진 또는 영상에 대한 질문이 주어졌을 때, AI가 사물과 상황을 인식해 자연어로 질문에 대한 답을 제시하는 기술이다. “제가 안경을 쓰고 있습니까라고 묻자, 인공 지능(AI)'그렇다'고 응답한다. 트럭이 횡단보도를 지나는 사진을 카메라에 비추며 지금 횡단보도를 건너도 되느냐고 묻자, AI'아니오'라고 정확하게 답한다.

 

T브레인은 AI 알고리즘 기술력을 바탕으로 한국어를 적용, 시각 장애인 활동 보조 서비스에 활용하도록 'KVQA' 데이터셋을 개발했다. 국내 최초이자 최대 규모 시각 장애인용 이미지 10만건을 확보, AI 인식 정확도를 국내 최고 수준으로 높였다. SK텔레콤은 중증. 경증 시각장애인이 사진을 촬영하고, 상황에 대한 질문을 하면, 상황과 관련한 10여개 응답을 입력하는 방식으로 데이터를 수집했다. 사진 구도와 초점이 흔들린 상태에서도 정확한 응답을 얻기 위해 사회적 기업 테스트웍스와 협업서해 시각 장애인이 사진을 찍도록 했다.

 

전재현 T브레인 비전 AI 담당 매니저는 연구 성과를 바탕으로 연내 시각 장애인용 활동 보조 서비스 개발이 목표이다. 장애인이 영상 또는 사진을 촬영하면, 스마트폰 또는 전용 단말기에 탑재된 AI가 설명해주는 방식으로 생활 편의를 높이게 될 것이라고 소개했다.

 

SK텔레콤은 VQA (시각적 질의 응답) 기술을 산업 분야에 폭넓게 적용할 계획이다. 산불 현장 등 사람이 진입하기 어려운 곳에 AI 기반 드론을 보내 원하는 정보를 파악하고, 즉각적으로 대응할 수 있도록 한다. 운송 수단 자율 주행은 물론이고, 교육 산업용 로봇 등에도 다양하게 응용될 것으로 기대했다.

 

T브레인은 AI 분야 글로벌 최고 인재가 모인 SK텔레콤 연구 조직이다. AI 원천 기술을 강화, 개별 사업 부서가 진화된 응용 서비스를 개발할 수 있도록 지원한다. 사회적으로 가치 있는 AI 기술과 빅데이터를 개방, 국내 AI 산업 생태계를 확장하는데 일조하겠다는 목표이다.

 

T브레인 임수현 에반젤리스트는 국내 최대 규모인 10만건 시각 장애인용 빅데이터를 개발자에게 개방하겠다. 일반인도 자유롭게 AI 모델을 구상, 서비스를 개발할 수 있도록 하는 메타러너 등 연구를 지속해서 국내 AI 생태계 발전에 기여하겠다고 역설했다. T브레인에만 존재하는 독특한 직위인 에반젤리스트는 AI 혁신 기술을 개발하고, AI 기술이 지닌 가치를 사내. 사외에 전파하는 역할이다.