연재칼럼 | 지난칼럼 |
나는 타자(打字)가 서툴고 느리다. 재주가 없는 모양이다. 그런데 이제 타자하는 수고를 벗어나게 되었다. 말하면 그걸 글자로 바꾸어 주고(STT; Speech to Text) 또 적은 글을 읽어주는 일(TTS; Text to Speech)을 스마트폰이나 컴퓨터가 해 준다.
이 친구들이 내 말을 잘 알아듣는다. 투박한 경상도 사투리이지만 몇 번 듣더니 내가 ‘바담풍’ 해도 ‘바람풍(風)’ 한다. 딥 러닝(deep learning)이라는 학습을 거친 인공지능 수재들이다. 우리 속담에 ‘말 타면 경마 잡히고 싶다’는 말이 있다. ‘경마 잡히는 것’은 종이나 마부에게 말고삐를 잡힌다는 말이다. 요술램프의 알라딘을 보고 불러주는 대로 받아 적어라, 적은 것을 읽어 보아라 하고 싶었던 일이 이제 가능해 졌다. 이 원고의 초안도 STT 앱으로 작성했다.
말을 글로 바꾸어주고 글을 읽어주면 편할 것이다. 최신형 스마트폰에는 이런 기능이 있다. 이런 기능이 없으면 내가 인공지능이나 앱에게 시키면 되지 않겠는가? ‘앱스토어’에 보면 수많은 STT 또는 TTS 앱이 있다. STT (Speech-to-Text) 앱은 음성을 텍스트로 변환해주니 회의록 작성, 외국어 학습, 팟캐스트 내용 정리 등을 하기 쉽고 특히 방대한 분량의 녹취록을 작성하는 데에는 엄청난 능력을 발휘한다.
대표적인 STT 앱으로 네이버의 클로바 노트, 다글로, 구글 문서(google docs) 등이 있다. 미국 뉴스나 영화를 보면서 도대체 무슨 말을 하는지 몰라서 답답했던 적이 많다. 너무 빠르기도 하지만 많이도 굴린다. 그걸 자막으로 보면서 겨우 이해를 한다. 골목과 곳곳을 감시하는 폐쇄회로(Closed-circuit) TV가 아니라 음성을 글자로 바꾸는 STT인 Closed-Caption TV 때문이다. 청각장애인에게는 필수인 자막을 만들어 주는 프로그램이다,
이제 번역까지 척척 한다. 동시통역도 가능하다. 역으로 글을 읽어주는 기능도 필요하다. 읽지 않고 들으면 편리하다. 이러한 TTS 앱으로는 VoiceAloud Reader, Narrator’s Voice, Google Text-to-Speech, NaturalReader 등이 있다. 이 외에도 많이 있다.
우리가 태어나서 부모님과 사회로부터 배워 쓰는 언어인 한글, 한국어는 자연어다. 이에 반에 인공어는 특히 컴퓨터에 쓰려고 만든 언어인데 기계(컴퓨터)를 작동시키기 위해 만든 프로그램인 운영체제(OS; Operating System)와 어떤 일을 하기 위해 만든 응용프로그램(Application Program)으로 나눈다. 이 응용프로그램, 두 단어를 3자로 줄여 앱(App)이라 부른다. 그러니 앱은 응용프로그램이다.
초기에 개발한 컴퓨터 프로그램 언어는 기계어(machine language)에 가까웠다. 특수문자나 기호를 사용한다. 그것이 2세대에 들면서 조립어(assemble language)로 발전했는데 이것도 사람들이 읽기는 거의 불가능한 것이다. 3세대 언어로 절차어(procedure language)인 Cobol, Fortran, Basic 등은 이제 잘 안 쓰지만 배워서 쓴 사람들도 있을 것이다.
4세대 언어는 쓰기 쉽고 막강한 기능을 가진 것이 되었는데 메뉴를 골라가며 쓰고(menu-driven) 또 함수나 매크로(자동 반복 수행) 기능 등이 있다. 우리가 많이 쓰는 엑셀이나 파워포인트, 워드(한글) 등이 4세대 언어다. 5세대 언어는 인공지능 프로그램에게 말로 해도 알아듣고 보고서(報告書)로 답을 해주는 생성형 인공지능 프로그램인 챗GPT 같은 것들이다.
‘한 입 베어 먹은 사과’ 같은 상표의 애플은 메뉴가 있는 4세대 언어와 그림모양을 보고 일을 시키는 GUI(Graphic User Interface) 운영체제를 먼저 내 놓았다. 프린터 그림을 누르면 인쇄를 하는 것처럼 사용하기 쉽도록 만든 것이다. 그러면서 많은 사람들이 앱을 만들어 팔도록 장터인 ‘앱스토어’를 제공하고는 수익을 나누어 가진다. 뒤늦게 구글은 ‘플레이스토어’를 만들었다.
PC를 만들지 않는 구글은 강력한 검색프로그램을 만들었고 스마트폰 시대를 예상하고 스마트폰의 운영체제, ‘안드로이드’를 먼저 내어 놓는다. 애플은 다른 스마트폰인 아이폰에 IOS라는 운영체제로 맞선다. MS 윈도우라는 운영체제와 익스플로러라는 브라우저 프로그램으로 기계 안 만들고 쉽게 돈 벌던 마이크로소프트는 인터넷과 스마트폰 시대를 얕보았는지 뒤늦게 브라우저로 엣지(edge), 검색엔진으로 빙(bing), 인공지능으로 빙챗을 내 놓았다.
강호(江湖)에는 무림(武林)의 고수(高手)들이 많다. 누가 어떤 내공(內功)이 있고 비기를 연마했는지 모른다. 챗GPT라는 고수가 등장하자 구글도 놀랐을 것이다. 검색만 해주는 것이 아니라 찾아서 요약하고 보고서를 만들어 준다. 떠먹여 주는 것이다. 말타니 경마 잡히고 싶다.
■ 조 기조(曺基祚 Kijo Cho)
. 경남대학교 30여년 교수직, 현 명예교수
. Korean Times of Utah에서 오래도록 번역, 칼럼 기고
. 최근 ‘스마트폰 100배 활용하기’출간 (공저)
. 현 한국도박문제관리센터 비상근 이사장으로 봉사
. kjcho@uok.ac.kr