top of page
적용사례
[한국정보통신기술협회] 인공지능 기반 자막-수어 변환 시스템 제작 용역
[2022-10-18]
본 사업은 “청각장애인용 자막수어 방송 시스템”을 개발하는 사업으로 자막-수어 번역엔진 성능 고도화 및 아바타 수어 애니메이션 제작하여 음성-자막-수어 앱에 상호 연동이 가능하도록 H/W, S/W를 구성하는 것을 목표로 합니다. 자막-수어 번역 서버 구축 및 연동 기능을 구현한 음성-자막-수어 앱 개발하고, 실사 기반 수어 애니메이션을 제작하여 앱과 통합한 형태로 제공합니다.
사업기간
- 2022. 05 ~ 2022. 11
주요성과
- 신규 미디어 영상 콘텐츠에 대한 수어 서비스를 제공하고, 청각 장애인의 인터넷 미디어 접근성 제고 기반 마련
- 실사 기반 수어 애니메이션 제작을 통하여 수어 방송 서비스 이용자에게 보다 자연스러운 수어 서비스 제공
본 사업은 “청각장애인용 자막수어 방송 시스템”을 개발하는 사업으로 자막-수어 번역엔진 성능 고도화 및 아바타 수어 애니메이션 제작하여 음성-자막-수어 앱에 상호 연동이 가능하도록 H/W, S/W를 구성하는 것을 목표로 합니다. 자막-수어 번역 서버 구축 및 연동 기능을 구현한 음성-자막-수어 앱 개발하고, 실사 기반 수어 애니메이션을 제작하여 앱과 통합한 형태로 제공합니다.
사업기간
- 2022. 05 ~ 2022. 11
주요성과
- 신규 미디어 영상 콘텐츠에 대한 수어 서비스를 제공하고, 청각 장애인의 인터넷 미디어 접근성 제고 기반 마련
- 실사 기반 수어 애니메이션 제작을 통하여 수어 방송 서비스 이용자에게 보다 자연스러운 수어 서비스 제공
[한국정보통신기술협회] 음성인식 기반 자동 음성-자막 변환 시스템 4차 시제품 제작 용역
[2022-10-17]
본 사업은 멀티미디어 자동자막 생성 미디어 재생 시스템 고도화 사업으로 Speech-to-Text 서버 성능 개선, 안드로이드 기반 미디어 재생 앱 기능 개선, iOS 기반 미디어 재생 앱 신규 개발, 학습 데이터 제작 등으로 구성되며, 기 구축된 서버 H/W를 제외한 앱, STT 솔루션, 실행 환경 일체를 포함하고 있습니다. 사업의 결과물로 TTA에 기구축된 스트리밍 서버, 음성인식 서버, 자막 생성 기능 성능 검증 도구 등과 S/W, H/W적으로 상호 연동이 가능하도록 개발하였습니다.
사업기간
- 2022. 04 ~ 2022. 10
주요성과
- 신규 미디어인 인터넷 영상 콘텐츠에 대한 자막 서비스를 제공하여 청각장애인의 미디어 접근성 제고 기반 마련
- 드라마, 예능 분야 인식률 향상 및 앱 기능 향상으로 3차년도 대비 전 장르에 걸친 자막 생성 서비스 이용율 증가 기대
본 사업은 멀티미디어 자동자막 생성 미디어 재생 시스템 고도화 사업으로 Speech-to-Text 서버 성능 개선, 안드로이드 기반 미디어 재생 앱 기능 개선, iOS 기반 미디어 재생 앱 신규 개발, 학습 데이터 제작 등으로 구성되며, 기 구축된 서버 H/W를 제외한 앱, STT 솔루션, 실행 환경 일체를 포함하고 있습니다. 사업의 결과물로 TTA에 기구축된 스트리밍 서버, 음성인식 서버, 자막 생성 기능 성능 검증 도구 등과 S/W, H/W적으로 상호 연동이 가능하도록 개발하였습니다.
사업기간
- 2022. 04 ~ 2022. 10
주요성과
- 신규 미디어인 인터넷 영상 콘텐츠에 대한 자막 서비스를 제공하여 청각장애인의 미디어 접근성 제고 기반 마련
- 드라마, 예능 분야 인식률 향상 및 앱 기능 향상으로 3차년도 대비 전 장르에 걸친 자막 생성 서비스 이용율 증가 기대
[NIA] AI학습용 데이터 교육과정 고도화 및 운영
[2022-10-14]
2021년도에 수행한 『NIA 인공지능 학습용 데이터 구축 참여인력 역량 강화 교육』 사업의 고도화 사업으로 전년도 개발〮운영한 ‘인공지능 학습용 데이터 라벨링 전문교육과정’의 참여자 피드백 및 업계 동향 등을 반영하여 교육 콘텐츠 개발 및 교육과정을 고도화하고 효과적인 학습방법 제공을 위해 교수 설계 방안을 제시합니다. 소리자바는 본 사업의 주관기관으로서 데이터 라벨러 과정 중 음성/텍스트 분야 교육과정을 개발하고 교육과정의 원활한 운영을 위한 교육 플랫폼을 개발하여 제공합니다.
사업기간
- 2022. 04 ~ 2022. 12
주요성과
- 고도화된 인공지능 학습용 데이터 교육과정을 통한 수준별 맞춤형 전문교육을 제공하여 경력개발 지원 및 인공지능 학습용 데이터 품질의 향상
2021년도에 수행한 『NIA 인공지능 학습용 데이터 구축 참여인력 역량 강화 교육』 사업의 고도화 사업으로 전년도 개발〮운영한 ‘인공지능 학습용 데이터 라벨링 전문교육과정’의 참여자 피드백 및 업계 동향 등을 반영하여 교육 콘텐츠 개발 및 교육과정을 고도화하고 효과적인 학습방법 제공을 위해 교수 설계 방안을 제시합니다. 소리자바는 본 사업의 주관기관으로서 데이터 라벨러 과정 중 음성/텍스트 분야 교육과정을 개발하고 교육과정의 원활한 운영을 위한 교육 플랫폼을 개발하여 제공합니다.
사업기간
- 2022. 04 ~ 2022. 12
주요성과
- 고도화된 인공지능 학습용 데이터 교육과정을 통한 수준별 맞춤형 전문교육을 제공하여 경력개발 지원 및 인공지능 학습용 데이터 품질의 향상
[보건복지부] 인공지능 상담 기록 시스템 구축
[2022-10-13]
전국 229개 시〮군〮구청의 아동청소년과에서 담당하는 아동학대 관련 조사 및 상담 시 소리자바 『Baronote』솔루션을 활용하여 휴대폰 또는 AI마이크를 통해 상담자와 피상담자의 음성정보를 수집, AI 음성인식 기술을 이용하여 실시간 자동조서 상담 녹취록 작성을 지원하는 인공지능 상담기록 시스템을 구축하였습니다. 현재까지 약 160여 개의 지자체에서 계약을 진행하여 70% 이상의 점유율을 달성하였습니다.
사업기간
- 2022. 01 ~ 현재 진행 중
주요성과
- 아동학대 관련 조서/상담 녹취록 작성시간의 획기적 절감 및 업무환경 개선으로 행정업무 고도화 기반 마련
- 아동학대 관련 조서 및 상담 녹취록 관리 및 권한 확립으로 보안성 강화
전국 229개 시〮군〮구청의 아동청소년과에서 담당하는 아동학대 관련 조사 및 상담 시 소리자바 『Baronote』솔루션을 활용하여 휴대폰 또는 AI마이크를 통해 상담자와 피상담자의 음성정보를 수집, AI 음성인식 기술을 이용하여 실시간 자동조서 상담 녹취록 작성을 지원하는 인공지능 상담기록 시스템을 구축하였습니다. 현재까지 약 160여 개의 지자체에서 계약을 진행하여 70% 이상의 점유율을 달성하였습니다.
사업기간
- 2022. 01 ~ 현재 진행 중
주요성과
- 아동학대 관련 조서/상담 녹취록 작성시간의 획기적 절감 및 업무환경 개선으로 행정업무 고도화 기반 마련
- 아동학대 관련 조서 및 상담 녹취록 관리 및 권한 확립으로 보안성 강화
[NIA] 2021년 한-페루 전자정부 공동협력사업
[2022-10-12]
한국과 페루가 2021년부터 2023년까지 “디지털정부협력센터”를 공동 운영함에 따라 한국의 디지털정부 발전경험을 효과적으로 공유하고 페루의 공공 거버넌스, 서비스의 질적 제고를 위한 디지털 전환을 지원하기 위한 사업입니다. 본 사업은 AI기반 시각/청각 장애인용 민원서비스 제공시스템 구축 로드맵 수립 및 타당성 조사를 실시하고 AI기반 개인 수준별 맞춤형 교육시스템 마스터플랜 수립, 페루 공무원 디지털 정부 역량을 강화를 위해 필요한 제반사항을 지원합니다.
사업기간
- 2021. 12 ~ 2022. 03
주요성과
- 우리나라 전자정부의 글로벌 브랜드 정착 및 국제적 위상 강화
- 전자정부 관련 국가간 협력으로 국내기업의 해외진출 지원 및 국가브랜드 이미지 향상
한국과 페루가 2021년부터 2023년까지 “디지털정부협력센터”를 공동 운영함에 따라 한국의 디지털정부 발전경험을 효과적으로 공유하고 페루의 공공 거버넌스, 서비스의 질적 제고를 위한 디지털 전환을 지원하기 위한 사업입니다. 본 사업은 AI기반 시각/청각 장애인용 민원서비스 제공시스템 구축 로드맵 수립 및 타당성 조사를 실시하고 AI기반 개인 수준별 맞춤형 교육시스템 마스터플랜 수립, 페루 공무원 디지털 정부 역량을 강화를 위해 필요한 제반사항을 지원합니다.
사업기간
- 2021. 12 ~ 2022. 03
주요성과
- 우리나라 전자정부의 글로벌 브랜드 정착 및 국제적 위상 강화
- 전자정부 관련 국가간 협력으로 국내기업의 해외진출 지원 및 국가브랜드 이미지 향상
[통일부] 북한정보 인공지능·빅데이터 분석시스템 STT 솔루션 구축
[2021-10-28]
4차 산업혁명 및 정부의 디지털 뉴딜 정책에 부합하는 지능형 북한정보 인공지능·빅데이터 분석체계를 도입하는 사업으로 북한말 음성인식을 위해 STT 솔루션을 도입하여 실시간 음성 변환 지원, 자체학습기능 및 북한어 음성인식률 85% 이상 구현, 솔루션 관리 및 권한 관리 기능 등을 제공합니다.
4차 산업혁명 및 정부의 디지털 뉴딜 정책에 부합하는 지능형 북한정보 인공지능·빅데이터 분석체계를 도입하는 사업으로 북한말 음성인식을 위해 STT 솔루션을 도입하여 실시간 음성 변환 지원, 자체학습기능 및 북한어 음성인식률 85% 이상 구현, 솔루션 관리 및 권한 관리 기능 등을 제공합니다.
[금융감독원] 금융상품정보분석시스템 구축 등 금융감독 고도화를 위한 정보화사업
[2021-10-28]
본 사업은 금융감독원의 금융상품판매정보시스템과 TM불완전판매식별지원시스템, 금융정보교환망시스템의 기능 개선 및 고도화를 위한 사업으로 특히 기존 TM불완전판매식별지원시스템에 적용된 소리자바의 알파케이의 성능 개선을 통해 녹취변환 파일 확대, STT 변환 결과 엑셀저장 및 키워드 검색 기능 개선, 녹취파일에 대한 조회 및 다운로드 기능, 청취 플레이어 기능 개선 등의 고도화를 진행하였습니다.
본 사업은 금융감독원의 금융상품판매정보시스템과 TM불완전판매식별지원시스템, 금융정보교환망시스템의 기능 개선 및 고도화를 위한 사업으로 특히 기존 TM불완전판매식별지원시스템에 적용된 소리자바의 알파케이의 성능 개선을 통해 녹취변환 파일 확대, STT 변환 결과 엑셀저장 및 키워드 검색 기능 개선, 녹취파일에 대한 조회 및 다운로드 기능, 청취 플레이어 기능 개선 등의 고도화를 진행하였습니다.
[금융감독원] 불공정거래 조사시스템
재구축 사업
[2021-10-27]
사용자 중심의 데이터 분석체계를 구축하고 시각적 분석기능 개선, 통합검색기능 개발, 시스템 UI/UX 개편 등을 통해 시스템의 불공정거래 대응능력을 강화하고 업무효율성을 제고하기 위한 사업입니다.
금융감독원에 기도입된 소리자바의 STT엔진(알파케이)을 불공정거래 제보에 적합한 형태로 수정하고, 적정 수준의 인식률 달성을 위한 학습을 진행하여 녹취파일에 대한 텍스트 변환기능을 제공합니다.
사용자 중심의 데이터 분석체계를 구축하고 시각적 분석기능 개선, 통합검색기능 개발, 시스템 UI/UX 개편 등을 통해 시스템의 불공정거래 대응능력을 강화하고 업무효율성을 제고하기 위한 사업입니다.
금융감독원에 기도입된 소리자바의 STT엔진(알파케이)을 불공정거래 제보에 적합한 형태로 수정하고, 적정 수준의 인식률 달성을 위한 학습을 진행하여 녹취파일에 대한 텍스트 변환기능을 제공합니다.
[NIA] AI학습용 데이터 구축 참여인력 역량 강화교육
[2021-10-26]
인공지능 학습용 데이터 구축 참여 인력의 역량강화 및 데이터 품질 향상을 위해 체계적인 교육과정이 필요함에 따라 사업에 참여하는 모든 라벨러 대상의 체계적인 교육을 실시하고 데이터 구축 참여자 및 크라우드 워커 대상으로 해당 분야 전문가로의 경력개발, 성장 및 진출을 할 수 있도록 단계별 교육과정을 마련하고 지원하기 위한 사업입니다.
소리자바는 데이터 라벨러 과정 중 음성/텍스트 분야 교육과정을 개발하고 운영합니다.
인공지능 학습용 데이터 구축 참여 인력의 역량강화 및 데이터 품질 향상을 위해 체계적인 교육과정이 필요함에 따라 사업에 참여하는 모든 라벨러 대상의 체계적인 교육을 실시하고 데이터 구축 참여자 및 크라우드 워커 대상으로 해당 분야 전문가로의 경력개발, 성장 및 진출을 할 수 있도록 단계별 교육과정을 마련하고 지원하기 위한 사업입니다.
소리자바는 데이터 라벨러 과정 중 음성/텍스트 분야 교육과정을 개발하고 운영합니다.
[시청자미디어재단] 2021년도 음성-자막 변환 인프라 구축 및 운영 용역
[2021-10-25]
한국정보통신기술협회(TTA)가 주관하고 소리자바가 개발한 음성-자막변환 시스템을 원활하게 작동시킬 수 있도록 실행환경을 구축하고 엔진 등 시스템 도입 및 인프라 환경 일체 운영하는 것으로 사용자가 시스템 어플리케이션을 무리 없이 이용할 수 있도록 환경을 유지하고 회원관리 및 알림 서비스 등의 관리 기능을 제공합니다.
사업기간
- 2021. 08 ~ 2021. 12
주요성과
- 음성-자막 변환 인프라 구축 및 운영으로 VOD, OTT 등 신규 미디어 영상 콘텐츠에 대한 자막 서비스를 제공하고, 청각 장애인의 인터넷 미디어 접근성 제고 기반 마련
- 청각 장애인 대상 어플리케이션 시범 서비스를 실시하여 실 사용자 의견 반영한 시스템 개선
한국정보통신기술협회(TTA)가 주관하고 소리자바가 개발한 음성-자막변환 시스템을 원활하게 작동시킬 수 있도록 실행환경을 구축하고 엔진 등 시스템 도입 및 인프라 환경 일체 운영하는 것으로 사용자가 시스템 어플리케이션을 무리 없이 이용할 수 있도록 환경을 유지하고 회원관리 및 알림 서비스 등의 관리 기능을 제공합니다.
사업기간
- 2021. 08 ~ 2021. 12
주요성과
- 음성-자막 변환 인프라 구축 및 운영으로 VOD, OTT 등 신규 미디어 영상 콘텐츠에 대한 자막 서비스를 제공하고, 청각 장애인의 인터넷 미디어 접근성 제고 기반 마련
- 청각 장애인 대상 어플리케이션 시범 서비스를 실시하여 실 사용자 의견 반영한 시스템 개선
[한국정보통신기술협회] 자막-수어 병렬 말뭉치 제작 용역
[2021-10-24]
일반 드라마 분야의 방송 자막으로부터 문장을 선정하여 한국어 자연어 문장을 제작하고, 이에 대응하는 1:1 이상의 한국 수어 번역 문장을 수어 번역 엔진의 학습에 활용 가능하도록 제작하는 것으로 번역 품질에 대한 자체 검증을 실시하고, 수어 번역 문장에 사용된 수어 단어-의미 맵핑 테이블을 제작하는 사업입니다.
사업기간
- 2021. 07 ~ 2021. 10
주요성과
- 한국어 자막 – 한국 수어 문장의 대규모 데이터를 확보할 수 있으며, 자막-수어 번역 엔진의 성능 향상에 기여
- 자막-수어 번역 엔진의 성능 향상을 통하여 향후 신규 미디어인 인터넷 영상 콘텐츠에 대한 수어 서비스를 제공함으로써 청각장애인의 미디어 접근성 제고 기반 마련
일반 드라마 분야의 방송 자막으로부터 문장을 선정하여 한국어 자연어 문장을 제작하고, 이에 대응하는 1:1 이상의 한국 수어 번역 문장을 수어 번역 엔진의 학습에 활용 가능하도록 제작하는 것으로 번역 품질에 대한 자체 검증을 실시하고, 수어 번역 문장에 사용된 수어 단어-의미 맵핑 테이블을 제작하는 사업입니다.
사업기간
- 2021. 07 ~ 2021. 10
주요성과
- 한국어 자막 – 한국 수어 문장의 대규모 데이터를 확보할 수 있으며, 자막-수어 번역 엔진의 성능 향상에 기여
- 자막-수어 번역 엔진의 성능 향상을 통하여 향후 신규 미디어인 인터넷 영상 콘텐츠에 대한 수어 서비스를 제공함으로써 청각장애인의 미디어 접근성 제고 기반 마련
[한국정보통신기술협회] 음성인식 기반 음성-자막 변환 시스템 3차 시제품 제작 사업
[2021-10-24]
음성인식 기술을 활용해 인터넷을 비롯한 인터넷 멀티미디어 영상의 음성을 인식하여 자체 STT서버를 통해 자막 생성 앱으로 전송 되는 시스템을 마련하는 것으로 STT서버, 미디어 재생 앱, 학습도구 등 일체를 포함하는 구성입니다. 또한 2020년『음성인식 기반 음성-자막 변환 시스템 2차 시제품 제작』 용역사업에 대한 고도화 작업 및 신규 개발 건을 모두 포함하고 있습니다.
사업기간
- 2021. 06 ~ 2021. 10
주요성과
- 신규 미디어인 인터넷 영상 콘텐츠에 대한 자막 서비스를 제공하여 청각장애인의 미디어 접근성 제고 기반 마련
- 드라마, 예능 등 다양한 분야의 영상에 대한 자막 생성 지원 및 다양한 기기 지원을 통하여 TTA 2차년도 대비 서비스 이용 범위 확대
음성인식 기술을 활용해 인터넷을 비롯한 인터넷 멀티미디어 영상의 음성을 인식하여 자체 STT서버를 통해 자막 생성 앱으로 전송 되는 시스템을 마련하는 것으로 STT서버, 미디어 재생 앱, 학습도구 등 일체를 포함하는 구성입니다. 또한 2020년『음성인식 기반 음성-자막 변환 시스템 2차 시제품 제작』 용역사업에 대한 고도화 작업 및 신규 개발 건을 모두 포함하고 있습니다.
사업기간
- 2021. 06 ~ 2021. 10
주요성과
- 신규 미디어인 인터넷 영상 콘텐츠에 대한 자막 서비스를 제공하여 청각장애인의 미디어 접근성 제고 기반 마련
- 드라마, 예능 등 다양한 분야의 영상에 대한 자막 생성 지원 및 다양한 기기 지원을 통하여 TTA 2차년도 대비 서비스 이용 범위 확대
[디지털뉴딜 과제] 2021년 AI학습용 데이터 구축-주제별 음성데이터 구축
[2021-10-22]
·주제별 음성 데이터 셋이란?
주제별 음성 데이터 셋은 한국인의 음성을 문자로 바꾸어 주고, 문맥을 이해하는 한국어 음성 언어처리 기술 개발을 위한 인공지능 학습용 한국어 음성 DB 셋으로 한국어로 된 회의 영상/음성을 인식하여 자동으로 회의록을 작성하고 자막을 생성하여 회의 내용 이해 서비스 제공을 위해 다양한 도메인에서 사용되는 전문 용어 및 약어가 포함된 회의 음성 데이터 구축 7,000시간 이상을 구축하였습니다.
구축된 데이터 셋을 바탕으로 회의록 자동 작성 및 요약 서비스, 대면/비대면 회의 통번역 서비스, 회의 스케줄러 및 비즈니스 관리 서비스 등 한국어 음성을 활용한 AI 서비스개발에 활용할 수 있습니다.
·데이터 구축 내용 및 제공 데이터량
- 실제 환경에서 녹음한 10개 산업 도메인 이상, 각 회의별 3인 이상의 발화자가 포함되어 있는 정제된 7,000시간 이상의 회의 음성 데이터와 그에 매치되는 전사 텍스트
- 발화자 정보(성별, 연령 등), 잡음환경 등 발화 환경 데이터, 전문 용어 및 약어 정보
·주제별 음성 데이터 셋이란?
주제별 음성 데이터 셋은 한국인의 음성을 문자로 바꾸어 주고, 문맥을 이해하는 한국어 음성 언어처리 기술 개발을 위한 인공지능 학습용 한국어 음성 DB 셋으로 한국어로 된 회의 영상/음성을 인식하여 자동으로 회의록을 작성하고 자막을 생성하여 회의 내용 이해 서비스 제공을 위해 다양한 도메인에서 사용되는 전문 용어 및 약어가 포함된 회의 음성 데이터 구축 7,000시간 이상을 구축하였습니다.
구축된 데이터 셋을 바탕으로 회의록 자동 작성 및 요약 서비스, 대면/비대면 회의 통번역 서비스, 회의 스케줄러 및 비즈니스 관리 서비스 등 한국어 음성을 활용한 AI 서비스개발에 활용할 수 있습니다.
·데이터 구축 내용 및 제공 데이터량
- 실제 환경에서 녹음한 10개 산업 도메인 이상, 각 회의별 3인 이상의 발화자가 포함되어 있는 정제된 7,000시간 이상의 회의 음성 데이터와 그에 매치되는 전사 텍스트
- 발화자 정보(성별, 연령 등), 잡음환경 등 발화 환경 데이터, 전문 용어 및 약어 정보
[디지털뉴딜 과제] 2021년 AI학습용 데이터 구축-대화 데이터 구축
[2021-10-21]
·대화 텍스트 데이터 셋이란?
대화 텍스트 데이터 셋은 범용적인 한국어 대화체 이해도 향상과 대화 생성 기술 개발을 위해 자유대화 및 다양한 일상 생활 주제(학업, 외모, 연애, 가족 및 친구 관계, 음식 등) 에 대한 대화를 SNS, 일상자유대화, 메신저 대화 등 다양한 플랫폼에서 수집한 데이터 셋으로 대화 데이터에 대한 텍스트 및 주제, 화행(Speech Act), 화자 및 화자 특성 등을 레이블링한 데이터입니다.
대화형 인공지능 시스템 연구에 활용할 수 있으며, 대화형 인공지능 서비스, 대화 화행 분석, 로봇, 가상 아바타 응답 인공지능 서비스 개발에 활용할 수 있습니다.
·데이터 구축 내용 및 제공 데이터량
- 일상 생활 주제 20종 이상, 주제별 대화 2,500세트(1세트 당 4~10턴 정도의 이어진 대화 수집) 이상 분포되도록 구축
- 약 50,000개의 대화 세트 데이터에 상응하는 120만(50,000 대화 * 평균 6문장* 문장당 평균 3~4 어절)어절 데이터
- 1:1 대화와 다자간 대화 비율 = 7:3
·대화 텍스트 데이터 셋이란?
대화 텍스트 데이터 셋은 범용적인 한국어 대화체 이해도 향상과 대화 생성 기술 개발을 위해 자유대화 및 다양한 일상 생활 주제(학업, 외모, 연애, 가족 및 친구 관계, 음식 등) 에 대한 대화를 SNS, 일상자유대화, 메신저 대화 등 다양한 플랫폼에서 수집한 데이터 셋으로 대화 데이터에 대한 텍스트 및 주제, 화행(Speech Act), 화자 및 화자 특성 등을 레이블링한 데이터입니다.
대화형 인공지능 시스템 연구에 활용할 수 있으며, 대화형 인공지능 서비스, 대화 화행 분석, 로봇, 가상 아바타 응답 인공지능 서비스 개발에 활용할 수 있습니다.
·데이터 구축 내용 및 제공 데이터량
- 일상 생활 주제 20종 이상, 주제별 대화 2,500세트(1세트 당 4~10턴 정도의 이어진 대화 수집) 이상 분포되도록 구축
- 약 50,000개의 대화 세트 데이터에 상응하는 120만(50,000 대화 * 평균 6문장* 문장당 평균 3~4 어절)어절 데이터
- 1:1 대화와 다자간 대화 비율 = 7:3
[디지털뉴딜 과제] 2021년 AI학습용 데이터 구축-대규모 한국어 말뭉치 데이터 구축
[2021-10-20]
·대규모 한국어 말뭉치 데이터 셋이란?
딥러닝 언어모델 개발을 위하여는 대용량 텍스트 데이터가 필요하며, 온라인 상호 교류 데이터 수집을 통해 다양한 상호작용(인터렉티브) 문장 표현, 감정 등을 학습할 수 있는 말뭉치 구축이 필요합니다. 이에 따라 단일 정보 중심이 아닌 공통된 관심 주제에 대한 의견 교류 및 상호 교류가 수행되는 다양한 플랫폼(게시판, 댓글, 오픈채팅 등)에서 토론 및 대화 위주의 구어체 말뭉치를 구축하였습니다.
구어체 학습 데이터를 활용하여 구어체 관련 언어모델의 사전학습에 대한 연구를 수행하며, 분야별 말뭉치 자료에서 핵심내용을 추출하여 요약 제공하는 서비스 개발에 활용할 수 있습니다.
·데이터 구축 내용 및 제공 데이터량
- 비대면 및 온라인 게시판, 댓글, 오픈 채팅 등 상호교류를 위한 텍스트, 대화에서의 구어체 말뭉치
- 5억 어절 분량의 말뭉치 데이터
·대규모 한국어 말뭉치 데이터 셋이란?
딥러닝 언어모델 개발을 위하여는 대용량 텍스트 데이터가 필요하며, 온라인 상호 교류 데이터 수집을 통해 다양한 상호작용(인터렉티브) 문장 표현, 감정 등을 학습할 수 있는 말뭉치 구축이 필요합니다. 이에 따라 단일 정보 중심이 아닌 공통된 관심 주제에 대한 의견 교류 및 상호 교류가 수행되는 다양한 플랫폼(게시판, 댓글, 오픈채팅 등)에서 토론 및 대화 위주의 구어체 말뭉치를 구축하였습니다.
구어체 학습 데이터를 활용하여 구어체 관련 언어모델의 사전학습에 대한 연구를 수행하며, 분야별 말뭉치 자료에서 핵심내용을 추출하여 요약 제공하는 서비스 개발에 활용할 수 있습니다.
·데이터 구축 내용 및 제공 데이터량
- 비대면 및 온라인 게시판, 댓글, 오픈 채팅 등 상호교류를 위한 텍스트, 대화에서의 구어체 말뭉치
- 5억 어절 분량의 말뭉치 데이터
[디지털뉴딜 과제] 2021년 AI학습용 데이터 구축-영상 및 이미지 편집기술 데이터 구축
[2021-10-19]
·영상 및 이미지 편집기술 데이터 셋이란?
영상 및 이미지 편집기술 데이터 셋은 언어(텍스트) 명령어를 통한 사진 편집 기술 등에 활용 가능한 데이터와 영상 콘텐츠 소비가 증가하면서 동영상 내용을 쉽게 유추하고 빠르게 탐색하기 위한 동영상 자동요약 서비스의 필요성이 대두됨에 따라 영상 및 이미지 편집 관련 인공지능 기술 개발에 필요한 학습용 영상 데이터 구축하였습니다.
사용자가 원하는 편집 방향을 언어로 정의함에 따라서 언어 기반 편집, 생성 기술 개발, 이미지 편집 기술개발에 활용될 수 있으며, 전반적인 영상 요약, 동영상 검색 등의 미디어 컨텐츠 관련 기술 발전을 위한 데이터로 활용될 수 있습니다.
·데이터 구축 내용 및 제공 데이터량
- 최소 90개 이상(컬러 변환 50개 이상, 편집 대상 객체 20개 이상, 모양 변환 20개 이상) 의 편집 기능 당 최소 1,000건 이상의 입력 이미지와 입력 언어 명령어 데이터. 총 10만장 이상의 편집 이미지 데이터
- 편집 명령어는 텍스트로 구축하며 대표 명령어와 유사 명령어 1:4 비율로 수집
- 총 2,000개 이상의 영상(동영상 길이 총 6,000시간 이상) - HD급 이상 화질의 영상 수집
- 각 영상에 대하여 최소 3명이 선정한 주요 장면과 내용 데이터
·영상 및 이미지 편집기술 데이터 셋이란?
영상 및 이미지 편집기술 데이터 셋은 언어(텍스트) 명령어를 통한 사진 편집 기술 등에 활용 가능한 데이터와 영상 콘텐츠 소비가 증가하면서 동영상 내용을 쉽게 유추하고 빠르게 탐색하기 위한 동영상 자동요약 서비스의 필요성이 대두됨에 따라 영상 및 이미지 편집 관련 인공지능 기술 개발에 필요한 학습용 영상 데이터 구축하였습니다.
사용자가 원하는 편집 방향을 언어로 정의함에 따라서 언어 기반 편집, 생성 기술 개발, 이미지 편집 기술개발에 활용될 수 있으며, 전반적인 영상 요약, 동영상 검색 등의 미디어 컨텐츠 관련 기술 발전을 위한 데이터로 활용될 수 있습니다.
·데이터 구축 내용 및 제공 데이터량
- 최소 90개 이상(컬러 변환 50개 이상, 편집 대상 객체 20개 이상, 모양 변환 20개 이상) 의 편집 기능 당 최소 1,000건 이상의 입력 이미지와 입력 언어 명령어 데이터. 총 10만장 이상의 편집 이미지 데이터
- 편집 명령어는 텍스트로 구축하며 대표 명령어와 유사 명령어 1:4 비율로 수집
- 총 2,000개 이상의 영상(동영상 길이 총 6,000시간 이상) - HD급 이상 화질의 영상 수집
- 각 영상에 대하여 최소 3명이 선정한 주요 장면과 내용 데이터
[LH공사] 빅데이터 플랫폼 STT 구축 사업
[2020-11-27]
STT 솔루션을 도입하여 변환된 비정형 텍스트데이터를 TA기능으로 분석할 수 있도록 상호 연계가 원활이 이루어지도록 구축하였습니다.
신뢰도, 자동학습 엔진을 통한 인식률 분석 및 텍스트 기반의 자동학습을 제공하며, 딥러닝을 활용한 자연어 처리 기능 및 딥러닝을 통한 인식률 제고가 가능하도록 하였습니다.
STT 솔루션을 도입하여 변환된 비정형 텍스트데이터를 TA기능으로 분석할 수 있도록 상호 연계가 원활이 이루어지도록 구축하였습니다.
신뢰도, 자동학습 엔진을 통한 인식률 분석 및 텍스트 기반의 자동학습을 제공하며, 딥러닝을 활용한 자연어 처리 기능 및 딥러닝을 통한 인식률 제고가 가능하도록 하였습니다.
[관세청] 빅데이터 STT 시스템 구축 사업
[2020-11-25]
관세 행정 실정에 맞는 분석의 정확도 향상을 위해 관세청 고유의 단어사전을 개발하고 Speech to text 기술이 적용된 텍스트 마이닝을 적용, 자연어 처리 지원 및 유사업 검색, 맞춤법 보정 등의 기능을 제공합니다.
관세 행정 실정에 맞는 분석의 정확도 향상을 위해 관세청 고유의 단어사전을 개발하고 Speech to text 기술이 적용된 텍스트 마이닝을 적용, 자연어 처리 지원 및 유사업 검색, 맞춤법 보정 등의 기능을 제공합니다.
[금융감독원] AI 빅데이터 기반 민원지원 시스템 구축 사업
[2020-11-04]
AI 기반의 STT엔진을 통해 상담 음성데이터를 텍스트 데이터로 변환하여 저장·관리할 STT 시스템을 구축하였습니다.
STT 시스템은 상담원과 금융소비자 등 화자별 발화 음성을 분리·저장하고, 텍스트로 변환해 통합·관리합니다.
또한 실시간·배치 방식을 모두 지원하며, 진행상황에 대한 모니터링 및 장애 시 재수행 할 수 있도록 구성하였습니다.
텍스트로 변환 후에는 신조어·전문화된 특수단어·오인식 등에 대한 보정이 가능하고, 지속적인 음성 학습 환경을 제공합니다.
사업기간
- 2020. 11 ~ 2021. 03
주요성과
- STT엔진을 통해 상담내용(음성)을 텍스트로 변환·축적하고 이를 바탕으로 민원상담에 대한 심층 분석 기반 마련
- 음성형태로 관리되고 있는 민원 상담내역을 STT엔진을 변환하고 이를 체계적으로 관리
- 변환된 민원상담 내역을 기존 콜센터 정보(상담일시, 상담분류 등)와 통합하여 효과적인 분석환경 마련
AI 기반의 STT엔진을 통해 상담 음성데이터를 텍스트 데이터로 변환하여 저장·관리할 STT 시스템을 구축하였습니다.
STT 시스템은 상담원과 금융소비자 등 화자별 발화 음성을 분리·저장하고, 텍스트로 변환해 통합·관리합니다.
또한 실시간·배치 방식을 모두 지원하며, 진행상황에 대한 모니터링 및 장애 시 재수행 할 수 있도록 구성하였습니다.
텍스트로 변환 후에는 신조어·전문화된 특수단어·오인식 등에 대한 보정이 가능하고, 지속적인 음성 학습 환경을 제공합니다.
사업기간
- 2020. 11 ~ 2021. 03
주요성과
- STT엔진을 통해 상담내용(음성)을 텍스트로 변환·축적하고 이를 바탕으로 민원상담에 대한 심층 분석 기반 마련
- 음성형태로 관리되고 있는 민원 상담내역을 STT엔진을 변환하고 이를 체계적으로 관리
- 변환된 민원상담 내역을 기존 콜센터 정보(상담일시, 상담분류 등)와 통합하여 효과적인 분석환경 마련
[ETRI] 자율주행차용 기동키워드 기반의 음성명령 시스템 구축
[2020-10-27]
자율주행차의 행선지 입력 및 주요 명령/제어를 위한 음성 인터페이스, 서버/클라이언트 운용 환경을 기반으로 하는 스마트패드 운용 소프트웨어, 터치 방식과 핸즈프리 방식을 동시에 지원하는 기동키워드 기반의 음성입력 소프트웨어, 자율주행차 거치 및 시연을 위한 물리 인터페이스를 개발하였습니다.
자율주행차의 행선지 입력 및 주요 명령/제어를 위한 음성 인터페이스, 서버/클라이언트 운용 환경을 기반으로 하는 스마트패드 운용 소프트웨어, 터치 방식과 핸즈프리 방식을 동시에 지원하는 기동키워드 기반의 음성입력 소프트웨어, 자율주행차 거치 및 시연을 위한 물리 인터페이스를 개발하였습니다.
[NIA] 손말이음센터 통신중계시스템 고도화를 위한 솔루션 도입
[2020-10-26]
클라우드 환경에서 최적화된 음성인식 엔진을 탑재하여 중계서비스 이용자 음성을 문자로 자동 변환, 기존 타이핑보다 효율적인(신속, 정확) 문자중계서비스가 가능한 자동 문자변환(STT) 기능을 제공합니다.
사업기간
- 2020. 10. ~ 2020. 12
주요성과
- 고사양 민간 클라우드를 활용한 고도화를 통해 중계서비스 중단 등 불안정성을 해소
- 통신중계서비스 수요에 유연하게 대응하고 중계업무 환경 개선을 통한 업무편의성 증대 및 운영효율성 제고
- 365일 24시간 원활하고 안정적인 통신중계서비스 제공으로 사용자 이용 편의 및 만족도 제고
클라우드 환경에서 최적화된 음성인식 엔진을 탑재하여 중계서비스 이용자 음성을 문자로 자동 변환, 기존 타이핑보다 효율적인(신속, 정확) 문자중계서비스가 가능한 자동 문자변환(STT) 기능을 제공합니다.
사업기간
- 2020. 10. ~ 2020. 12
주요성과
- 고사양 민간 클라우드를 활용한 고도화를 통해 중계서비스 중단 등 불안정성을 해소
- 통신중계서비스 수요에 유연하게 대응하고 중계업무 환경 개선을 통한 업무편의성 증대 및 운영효율성 제고
- 365일 24시간 원활하고 안정적인 통신중계서비스 제공으로 사용자 이용 편의 및 만족도 제고
[인천국제공항공사] 음성인식 및 화상안내 스마트 사이니지 고도화 사업
[2020-10-12]
2019년에 수행한 ‘AI 기반 음성인식 스마트사이니지 시범사업’에 이은 사업으로 소리자바의 인천국제공항 두 번째 성공사례로 AI 음성인식(STT)과 음성합성(TTS), 텍스트 분석(TA)기술을 접목하였으며, 다국어 음성인식 확장이 가능한 고성능 엔진을 적용하였습니다.
또한 화상 안내 솔루션 신규 도입 및 커스터마이징을 진행하여 안내데스크 인력을 통한 원격 화상안내 서비스를 제공합니다.
특히 주변소음, 청사 내 안내방송 등 외부 노이즈 환경에도 높은 음성인식률을 확보하기 위해 자체개발 적응형 빔포밍 마이크로폰을 설치하여 한국어 기준 음성 인식률 93%, 서비스 성공률 95%를 달성하였고, 영어는 음성 인식률 91%, 서비스 성공률 93%를 달성하며 목표치를 초과 달성하여 성능을 증명하였습니다.
사업기간
- 2020. 10 ~ 2021. 06
주요성과
- 시범 운영 중인 AI 음성인식 안내기능을 全 S-BOARD 단말로 확대 도입하여 4차 산업혁명 기술구현을 선도하는 Smart Airport 이미지 제고
- 터미널 모든 지역에 S-BOARD를 통한 24시간 화상안내서비스를 제공하여 인력 중심의 안내데스크 운영체계를 스마트 기술 기반의 미래형 체계로 개선
2019년에 수행한 ‘AI 기반 음성인식 스마트사이니지 시범사업’에 이은 사업으로 소리자바의 인천국제공항 두 번째 성공사례로 AI 음성인식(STT)과 음성합성(TTS), 텍스트 분석(TA)기술을 접목하였으며, 다국어 음성인식 확장이 가능한 고성능 엔진을 적용하였습니다.
또한 화상 안내 솔루션 신규 도입 및 커스터마이징을 진행하여 안내데스크 인력을 통한 원격 화상안내 서비스를 제공합니다.
특히 주변소음, 청사 내 안내방송 등 외부 노이즈 환경에도 높은 음성인식률을 확보하기 위해 자체개발 적응형 빔포밍 마이크로폰을 설치하여 한국어 기준 음성 인식률 93%, 서비스 성공률 95%를 달성하였고, 영어는 음성 인식률 91%, 서비스 성공률 93%를 달성하며 목표치를 초과 달성하여 성능을 증명하였습니다.
사업기간
- 2020. 10 ~ 2021. 06
주요성과
- 시범 운영 중인 AI 음성인식 안내기능을 全 S-BOARD 단말로 확대 도입하여 4차 산업혁명 기술구현을 선도하는 Smart Airport 이미지 제고
- 터미널 모든 지역에 S-BOARD를 통한 24시간 화상안내서비스를 제공하여 인력 중심의 안내데스크 운영체계를 스마트 기술 기반의 미래형 체계로 개선
비대면 화상수어 교육 시스템 및 AI 음성인식 자동자막 시스템 개발
[2020-10-08]
원격강의 시스템은 HTML5를 적용한 WebRTC 영상 전송 방식으로 별도의 플러그인 설치가 필요 없는 언택트 화상 솔루션입니다.
화상 시스템 Server To STT Server의 음성 신호통신 방식으로 구현하며 TDNN Chained LSTM 방식의 최신 딥러닝 알고리즘을 적용한 알파 K2 STT 엔진으로 높은 정밀도의 음성-문자 변환 인터페이스를 제공합니다.
사업기간
- 2020. 12 ~ 2021. 02
주요성과
- 기존 오프라인 교육을 대체하여 원격교육 시스템 도입을 통한 참여도 및 교육 효율성 증대
- 수어 전문 교육 시스템 및 양방향 교육이 가능한 최신 화상 원격교육 시스템 신기술 도입
원격강의 시스템은 HTML5를 적용한 WebRTC 영상 전송 방식으로 별도의 플러그인 설치가 필요 없는 언택트 화상 솔루션입니다.
화상 시스템 Server To STT Server의 음성 신호통신 방식으로 구현하며 TDNN Chained LSTM 방식의 최신 딥러닝 알고리즘을 적용한 알파 K2 STT 엔진으로 높은 정밀도의 음성-문자 변환 인터페이스를 제공합니다.
사업기간
- 2020. 12 ~ 2021. 02
주요성과
- 기존 오프라인 교육을 대체하여 원격교육 시스템 도입을 통한 참여도 및 교육 효율성 증대
- 수어 전문 교육 시스템 및 양방향 교육이 가능한 최신 화상 원격교육 시스템 신기술 도입
[전국 60개 교육청] 음성인식 회의시스템 구축 사업
[2020-09-09]
서울, 경기, 인천, 대전, 대구, 부산 등 전국 60개 교육지원청 주관 학교폭력심의위원회의 다양한 회의 상황에서 여러 사람이 회의하는 다자간 회의내용을 대화자 및 발언 내용을 정확히 구분하여 인식하고, 음성인식률 90% 수준의 음성인식 엔진을 구축하는 등 국내 교육지원청 음성 인식 시스템 구축 최다 실적을 보유하고 있습니다.
구축 완료 지원청
- 서울시 11개청, 경기도 25개청, 인천시 5개청, 부산시 5개청, 대구시 4개청, 대전시 2개청, 울산 1개청, 충남 2개청, 충북 1개청, 광주시 1개청, 전북 2개청 등 전국교육지원청 총 60개청
주요성과
- 학교폭력 사안 심의를 위한 학교폭력대책심의위원회 회의록 작성에 소요되는 시간, 인력, 속기료 비용 절감
- 음성정보의 텍스트화, 다양한 특성에 맞는 변환 및 저장으로 업무 효율성 증대
- 인공지능 기반 신기술 도입으로 공공부문의 일하는 방식의 변화 선도
서울, 경기, 인천, 대전, 대구, 부산 등 전국 60개 교육지원청 주관 학교폭력심의위원회의 다양한 회의 상황에서 여러 사람이 회의하는 다자간 회의내용을 대화자 및 발언 내용을 정확히 구분하여 인식하고, 음성인식률 90% 수준의 음성인식 엔진을 구축하는 등 국내 교육지원청 음성 인식 시스템 구축 최다 실적을 보유하고 있습니다.
구축 완료 지원청
- 서울시 11개청, 경기도 25개청, 인천시 5개청, 부산시 5개청, 대구시 4개청, 대전시 2개청, 울산 1개청, 충남 2개청, 충북 1개청, 광주시 1개청, 전북 2개청 등 전국교육지원청 총 60개청
주요성과
- 학교폭력 사안 심의를 위한 학교폭력대책심의위원회 회의록 작성에 소요되는 시간, 인력, 속기료 비용 절감
- 음성정보의 텍스트화, 다양한 특성에 맞는 변환 및 저장으로 업무 효율성 증대
- 인공지능 기반 신기술 도입으로 공공부문의 일하는 방식의 변화 선도
[행정안전부] 전자정부 클라우드 플랫폼 구축사업 AI 음성인식 솔루션 도입
[2020-08-18]
전자정부 클라우드 플랫폼 구축사업의 플랫폼 통합관리시스템의 지능형 기술 서비스 제공을 위한 AI 음성인식 솔루션을 도입하여 전자정부 및 공공정보시스템의 지능정보기반 新가치 창출 및 효율성을 향상하고, 비용을 절감하며 인프라 이외에 S/W 자원까지 확장성, 유연성을 확보하여 대민 서비스를 제공합니다.
사업기간
- 2020. 08 ~ 2020. 10
주요성과
- 국가기관의 SW 기술력 확보, 서비스 재사용 확대로 개발생산성 향상 및 전자정부 품질 제고에 기여
- 인프라 이외에 SW 자원까지 확장성, 유연성 확보로 대민서비스 탄력성, 안정성 제고 및 자원효율성 강화
- 공공정보화를 통해 국내 클라우드 솔루션 개발기업, 클라우드 환경을 활용한 시스템 개발 기업 등의 기술경험 축적 및 경쟁력 제고
전자정부 클라우드 플랫폼 구축사업의 플랫폼 통합관리시스템의 지능형 기술 서비스 제공을 위한 AI 음성인식 솔루션을 도입하여 전자정부 및 공공정보시스템의 지능정보기반 新가치 창출 및 효율성을 향상하고, 비용을 절감하며 인프라 이외에 S/W 자원까지 확장성, 유연성을 확보하여 대민 서비스를 제공합니다.
사업기간
- 2020. 08 ~ 2020. 10
주요성과
- 국가기관의 SW 기술력 확보, 서비스 재사용 확대로 개발생산성 향상 및 전자정부 품질 제고에 기여
- 인프라 이외에 SW 자원까지 확장성, 유연성 확보로 대민서비스 탄력성, 안정성 제고 및 자원효율성 강화
- 공공정보화를 통해 국내 클라우드 솔루션 개발기업, 클라우드 환경을 활용한 시스템 개발 기업 등의 기술경험 축적 및 경쟁력 제고
bottom of page