Tích hợp công nghệ tiếng Việt vào ứng dụng Mobile Portal

Ngày 12/2/2014, tại Hà Nội, Ban chủ nhiệm Chương trình KC.01/11-15 đã tổ chức họp Hội đồng đánh giá nghiệm thu cấp Nhà nước cho Dự án “Triển khai tích hợp công nghệ tổng hợp tiếng Việt vào ứng dụng mobile portal phục vụ cho đời sống xã hội”, mã số: KC 01.DA01/11-15, thuộc Chương trình Khoa học và Công nghệ (KH&CN) trọng điểm cấp Nhà nước KC.01/11-15 do ThS. Nguyễn Hoàng Trung- Công ty cổ phần Dịch vụ Công nghệ thông tin Naiscorp làm chủ nhiệm đề tài.

01_Tich hop cong nghe tieng Viet vao dụng mobile portal
Toàn cảnh buổi nghiệm thu

Hiện tại, ở nước ta đã có nhiều nhóm nghiên cứu về đề tài xử lý tiếng nói và văn bản tiếng Việt. Tuy nhiên các kết quả nghiên cứu của các đơn vị trên mới chỉ được gói gọn trong phòng thí nghiệm mà chưa được đưa ra áp dụng thực tế hoặc chỉ được áp dụng ở quy mô nhỏ.

Theo ThS. Nguyễn Hoàng Trung, Dự án SXTN này được phát triển từ đề tài cấp Nhà nước “Nghiên cứu phát triển một số sản phẩm thiết yếu xử lý tiếng nói và văn bản tiếng Việt” thuộc chương trình KH&CN trọng điểm cấp Nhà nước, mã số: KC.01.01/06-10, đánh giá nghiệm thu ngày 11/12/2009. Do PGS.TS Lương Mai Chi- Viện Công nghệ thông tin, Viện Hàn lâm KH&CN Việt Nam làm chủ nhiệm đề tài. Một số công nghệ cho tổng hợp tiếng Việt đã được khảo sát và nghiên cứu bao gồm phương pháp ghép nối các đơn vị âm cơ bản và phương pháp tổng hợp theo tham số dùng mô hình Marko ẩn.

Một trong những kết quả của đề tài là phát triển engine tổng hợp tiếng Việt theo phương pháp áp dụng mô hình Marko ẩn (engine VieTalk). Ưu điểm nổi bật của phương pháp tổng hợp dựa trên HMM là cho phép phát sinh tiếng nói từ tham số, dễ dàng thay đổi đặc điểm giọng nói, dễ áp dụng cho các ngôn ngữ khác nhau. Nhờ khả năng huấn luyện cho các chủ đề tin tức khác nhau, các mô hình Marko lưu trữ tự động các thông tin về tiếng nói trong một số giới hạn các tham số của mô hình. Trong quá trình tổng hợp ra tiếng nói, việc phát sinh lại tham số tiếng nói để tái tạo âm thanh từ chuỗi liên tục các node trạng thái HMM, giúp tiếng nói tổng hợp trơn và có chất lượng cao. Việc tích hợp engine VieTalk cho Dự án SXTN này là phù hợp về mục đích và yêu cầu kỹ thuật, công nghệ.

ThS. Nguyễn Hoàng Trung cho biết: “Sau khi nghiên cứu nhu cầu của thị trường, tìm hiểu về công nghệ của đề tài do Viện Công nghệ thông tin chủ trì, chúng tôi nhận thấy đây là một thành quả nghiên cứu đã được công nhận và là một cơ sở tốt để tiếp tục nghiên cứu, phát triển thêm các tính năng mới nhằm mục đích ứng dụng công nghệ tổng hợp tiếng nói vào Dự án sản xuất”.

Dự án đã tạo ra một công cụ tổng hợp tiếng nói Online chỉ cần băng thông yếu với 10 kbit/s là người dùng có thể sử dụng dịch vụ sản phẩm. Khi nhận được một yêu cầu, hệ thống tìm ra văn bản phù hợp nhất để tổng hợp tiếng nói và gửi kết quả cho người dùng. Muốn có dữ liệu dạng text để tổng hợp tiếng nói thì phải tạo ra một hệ thống Crawler – lưu trữ dữ liệu – là công việc lấy thông tin có sẵn từ internet, lọc tách dữ liệu cần thiết và lưu trữ sẵn vào hệ thống máy chủ.

Các thành phần, nhiệm vụ của hệ thống là: lấy dữ liệu thô từ internet bao gồm hơn 300 triệu trang webb tiếng Việt được lấy về bằng sever Crawler (sử dụng công nghệ Crawler); dữ liệu đó được lưu trữ vào một kho lưu trữ hàng tỷ văn bản, là đầu vào cho hệ thống tổng hợp tiếng nói với nhiều giọng theo vùng miền và nhiều thể loại khác nhau…

Khi Dự án kết thúc, sản phẩm Mobile Portal đưa vào thị trường với số người sử dụng lên tới hàng triệu, chắc chắn sẽ mang lại hiệu quả kinh tế cao, vì sau khi đưa vào sản xuất đại trà, dự án có thể tạo ra doanh thu 24,6 tỷ đồng kể từ năm thứ 3 trở đi. Bên cạnh đó, ngoài việc mang lại hiệu quả kinh tế cho cơ quan chủ trì đề tài thì sản phẩm của dự án còn mang lại hiệu quả kinh tế cho bên cơ sở nghiên cứu và các bên cung cấp nội dung khác.

Công nghệ tổng hợp tiếng nói theo mô hình Markov ẩn không chỉ cho phép tổng hợp âm thanh tiếng Việt mà còn có thể sử dụng với tất cả ngôn ngữ khác. Dự án cơ thể tiếp tục mở rộng nghiên cứu và triển khai ở một số ngôn ngữ của các dân tộc ít người.

Dự án là sự kết hợp giữa công ty Naiscorp và Viện Công nghệ thông tin, trong đó công ty Naiscorp ứng dụng kết quả nghiên cứu khoa học của Viện Công nghệ thông tin. Về kinh doanh, từ năm 2012 – 2014 dự án đã tạo ra doanh thu 30 tỷ đồng cho công ty Naiscorp.

Kết thúc buổi nghiệm thu, Hội đồng đánh giá cao nhóm thực hiện dự án đã có nhiều nỗ lực bổ sung theo yêu cầu của Hội đồng. Bên cạnh đó, các thành viên hội đồng đã có nhiều ý kiến góp ý về hình thức cũng như nội dung như: hoàn thiện thuyết minh, làm rõ tính mới trong phần mềm sử dụng tiếng Việt khi ứng dụng vào thực tế, cần làm rõ bản đánh giá chất lượng và kết quả đánh giá của sản phẩm, phần doanh thu cần bóc tách rõ ràng về đóng góp của sản phẩm.

Nguồn: VPCT

Trả lời

Thư điện tử của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *