본문 바로가기
엑쓸신잡/월간기술동향

월간기술동향 | AI와 대화를? 소오-름

by EXEM 2018. 10. 1.

 

 

 



아이언맨의 인공지능 비서 ‘자비스’를 아시나요?

아이언맨이 자비스에게 지시를 하면, 자비스는 그의 말을 정확히 인지하고 지시를 수행합니다. 자비스가 실제로 나의 비서가 된다면 얼마나 좋을까요?현실에서도 자비스와 같은 인공지능 비서를 사용하게 될 날이 멀지 않은 것 같습니다. 


지난 5월, 구글 I/O 컨퍼런스에서는 놀라운 시연이 펼쳐졌습니다. 인공지능 비서 구글 어시스턴트가 직접 미용실에 전화해 직원과 대화하여 예약을 해주고 쉬는 날을 확인하는 시연을 보였는데요. 아마 아래 영상을 보시면 깜짝 놀라실 겁니다.

 
 
 

<영상 출처: YouTube, Jeffrey Grubb>


첫 번째 시연 중 미용실 직원의 기다려 달라는 말에 사람처럼 ‘으-흠’하고 반응하는 인공지능의 모습. 정말 놀랍지 않나요? 이 놀라운 광경은 구글 어시스턴트가 실제로 대화의 뉘앙스를 이해한다는 것이며, 이 기술을 “구글 듀플렉스”라 부른다고 구글 순다 피차이 CEO가 말했습니다. 


그래서 이번 시간에는 구글 듀플렉스와 그 중심 기술에 대해 알아보도록 하겠습니다.

 
 
 
 Google Duplex 


구글 듀플렉스는 기존 대화형 AI보다 더 진화된 모습을 보여줍니다. 사람을 대하는 것처럼 자연스러운 대화 경험을 제공하며, 대화가 예상대로 흘러가지 않을 때도 지능적으로 반응할 수 있습니다. 음성도 아주 자연스럽고요.


듀플렉스의 중심에는 TFX(TensorFlow Extended)를 사용하여 설계된 순환 신경망(RNN, Recurrent Neural Network)이 있습니다. 높은 정밀도를 얻기 위해 구글에서는 익명 처리된 수십만 건의 온라인 예약 음성 녹음 데이터를 반복 학습시켰다고 합니다. 

<출처: Google AI Blog, Google Duplex: An AI System for Accomplishing Real-World Tasks Over the Phone>

 

 

 

 RNN이란? 


그렇다면, 위에서 언급한 순환 신경망(RNN, Recurrent Neural Network)에 대해 간단하게 알아봅시다. 

음악, 동영상, 에세이, 시... 이것들의 공통점은 무엇일까요? 바로 시퀀스라는 점입니다. 음악은 음계들의 시퀀스, 동영상은 이미지의 시퀀스, 에세이는 단어들의 시퀀스로 볼 수 있습니다. 시퀀스의 길이는 가변적입니다. 소설에는 단편소설도 있고 장편소설도 있는 것과 같죠. 


RNN은 시퀀스 데이터를 모델링 하기 위해 등장했습니다. 

RNN이 기존의 뉴럴 네트워크와 다른 점은 ‘기억’을 갖고 있다는 점입니다. 네트워크의 기억은 지금까지의 입력 데이터를 요약한 정보라고 볼 수 있습니다. 새로운 입력이 들어올 때마다 네트워크는 자신의 기억을 조금씩 수정합니다. 결국 입력을 모두 처리하고 난 후 네트워크에게 남겨진 기억은 시퀀스 전체를 요약하는 정보가 됩니다. 


이는 사람이 시퀀스를 처리하는 방식과 비슷합니다. 이 글을 읽을 때도 우리는 이전까지의 단어에 대한 기억을 바탕으로 새로운 단어를 이해합니다. 이 과정은 새로운 단어마다 계속해서 반복되기 때문에 RNN에는 Recurrent, 즉 순환적이라는 이름이 붙습니다. RNN은 이런 반복을 통해 아무리 긴 시퀀스라도 처리할 수 있는 것입니다.

<출처: Dreamgonfly’s github, RNN 다이어그램 >


위 다이어그램에서 빨간색 사각형은 입력, 노란색 사각형은 기억, 파란색 사각형은 출력을 나타냅니다. 첫번째 입력이 들어오면 첫번째 기억이 만들어집니다. 두번째 입력이 들어오면 기존의 기억과 새로운 입력을 참고하여 새 기억을 만듭니다. 입력의 길이만큼 이 과정을 얼마든지 반복할 수 있습니다. 


각각의 기억은 그때까지의 입력을 요약해서 갖고 있는 정보입니다. RNN은 이 요약된 정보를 바탕으로 출력을 만들어 냅니다.

 

 

 

 RNN의 활용 

이젠 RNN을 활용한 쉬운 예들을 보여 드릴게요. 한번에 이해하실 수 있을 것 같습니다.

1.연관 검색어

우리가 단어를 입력하면 다음 단어를 예상해서 연관 검색어를 알려주죠.

<구글에서 엑셈을 검색하면..?>


2.자동 번역

구글 번역기와 네이버 파파고는 RNN을 응용한 모델로 만들어 졌다는 사실! 



이번 시간에 구글 듀플렉스를 통해 구글의 자연어 처리 기술이 얼마나 향상되었는지 알 수 있었고, RNN에 대해서도 간단하게 알아보았습니다. 

구글은 스타벅스ㆍ도미노피자ㆍ파네라브레드 등과 파트너십 계약을 맺고 듀플렉스를 통한 주문 기능을 활용할 예정이라고 하며, 올해 안에 인공지능 비서 서비스 ‘구글 어시스턴트’에 듀플렉스가 추가될 것이라고 밝혔습니다.

인공지능 기술의 가능성과 잠재력에 대해 더욱 기대가 되는데요, 다음 시간에도 흥미로운 내용으로 찾아 뵙도록 하겠습니다.



Reference
https://youtu.be/D5VN56jQMWM 
https://ai.googleblog.com/2018/05/duplex-ai-system-for-natural-conversation.html 
https://dreamgonfly.github.io/rnn/2017/09/04/understanding-rnn.html
http://www.wildml.com/2015/09/recurrent-neural-networks-tutorial-part-1-introduction-to-rnns/ 





기획 및 글 | 사업기획팀 박예영


댓글