Chuyển đổi văn bản tiếng Việt sang giọng nói tự nhiên

Thứ Bảy, 29/12/2018, 02:18:35

Vượt qua gần 320 sản phẩm dự thi, và được chọn là một trong 20 sản phẩm công nghệ thông tin (CNTT) vào chung khảo, cuối cùng “Giải pháp ứng dụng công nghệ trí tuệ nhân tạo chuyển đổi văn bản tiếng Việt sang giọng nói tự nhiên Vbee” của nhóm tác giả Công ty cổ phần dịch vụ và giải pháp xử lý dữ liệu Vbee đã giành giải nhì (không có giải nhất) Giải thưởng Nhân tài đất Việt năm 2018.

Chuyển đổi văn bản tiếng Việt sang giọng nói tự nhiên

Nhóm tác giả Công ty cổ phần dịch vụ và giải pháp xử lý dữ liệu Vbee nhận giải nhì lĩnh vực công nghệ thông tin tại giải thưởng Nhân tài đất Việt 2018. Ảnh: MINH SƠN

Kỹ sư Hồ Minh Đức, thành viên nhóm tác giả thuộc Công ty cổ phần dịch vụ và giải pháp xử lý dữ liệu Vbee chia sẻ: “Giành được giải thưởng là niềm vinh dự nhưng mới chỉ là bước khởi đầu. Thời gian tới, nhóm sẽ tập trung mở rộng việc ứng dụng sản phẩm vào đời sống xã hội trong xu hướng của cuộc cách mạng công nghiệp 4.0”. Đức nhập một đoạn tin từ một tờ báo vào chiếc điện thoại đang cầm, thực hiện vài thao tác và thế là một giọng đọc miền bắc như giọng người thật vang lên. Với bất cứ thông tin nào được nhập vào điện thoại cầm tay sẽ được nghe giọng đọc miền bắc hay miền nam tùy ý...

TS Nguyễn Thu Trang, trưởng nhóm nghiên cứu cho biết, nhóm đã ứng dụng công nghệ Text - to - Speech (công nghệ xử lý văn bản thành giọng nói). Công nghệ này đã được nghiên cứu và phát triển mạnh ở các quốc gia sử dụng tiếng Anh cách đây khoảng 15 năm. Còn với nhóm, từ năm 2009, kỹ sư Hồ Minh Đức đã có ý tưởng, đến năm 2015, khi Nguyễn Thu Trang bảo vệ luận án tiến sĩ ở Pháp về mới bắt tay nghiên cứu và ứng dụng công nghệ chuyển văn bản tiếng Việt thành giọng nói tự nhiên của con người. Ban đầu, sản phẩm hướng vào cộng đồng người khiếm thị, người mất khả năng đọc và nói. Từng bước, Vbee đưa công nghệ này ứng dụng trong lĩnh vực giao thông, đó là ứng dụng Vadi (còn gọi là bản đồ giao thông). Ứng dụng này định vị được vị trí phương tiện giao thông và cảnh báo bằng lời nói cho người lái xe biết tình trạng tắc đường, tai nạn trên tuyến đường đi qua tại thời gian thực nhằm giúp lái xe chủ động tìm đường đi thuận lợi hơn. Dữ liệu đầu vào là các thông tin về giao thông được gõ, chuyển vào hệ thống. Ngoài ra, Vadi được tích hợp công nghệ đọc báo, phục vụ nhu cầu giải trí của người ngồi trên xe. Người dùng có thể chọn đọc một bài báo với giọng đọc có ngữ điệu và biểu cảm chứ không phải giọng như của người máy. Điểm khác biệt và cũng là tính ưu việt của công nghệ xử lý văn bản thành giọng nói của Vbee là việc xử lý được ngôn ngữ tiếng Việt theo các cấp độ và tính chất khác nhau (giọng nói như người thật, thực hiện giọng các vùng, miền trong cả nước, thể hiện giọng đọc theo giới tính, lứa tuổi và các sắc thái biểu cảm khác nhau...).

Sản phẩm Vietnamese text to speech của nhóm nghiên cứu ra mắt thị trường vào giữa năm 2018, đến nay, đã có hơn 200 doanh nghiệp và nhiều tổ chức, cá nhân ký kết để sử dụng. Chẳng hạn, Công ty cổ phần Lumi Việt Nam (Hà Nội), sử dụng giải pháp của Vbee để tạo thành sản phẩm điều khiển nhà thông minh (loa thông minh); Công ty cổ phần Dịch vụ CNTT NaisCorp (Hà Nội) ứng dụng sản phẩm của Vbee để thực hiện dự án số hóa sách tự động. Bên cạnh xây dựng kho sách nói tự động, đầy đủ nhất cho lĩnh vực xuất bản điện tử, ứng dụng còn là tiền đề cho kho dữ liệu sách chính thống phục vụ người khiếm thị, người không có khả năng đọc. Một số doanh nghiệp như VNG, Iris Media, CloudFone, Tel4VN… bước đầu sử dụng và cũng đã có những ý kiến phản hồi tích cực về công nghệ của Vbee. Giải pháp chuyển đổi văn bản tiếng Việt sang giọng nói tự nhiên như con người của Vbee mở ra triển vọng ứng dụng trên nhiều lĩnh vực đời sống xã hội như hoạt động của các nhà mạng, vận tải hành khách, thương mại điện tử, các tổng đài tự động, dịch vụ ngân hàng thông minh, phát thanh truyền hình, giáo dục và đào tạo, chăm sóc sức khỏe trong các bệnh viện, dịch vụ du lịch và giải trí.

Trong xu thế phát triển như vũ bão của cách mạng công nghiệp 4.0, công cuộc chuyển đổi số, ứng dụng trí tuệ nhân tạo, in-tơ-nét kết nối vạn vật... đã và đang được khích lệ và thúc đẩy nhằm hướng tới nền kinh tế số và số hóa nhiều hoạt động của con người. Sản phẩm “Giải pháp ứng dụng công nghệ trí tuệ nhân tạo chuyển đổi văn bản tiếng Việt sang giọng nói tự nhiên Vbee” cùng hàng chục kết quả nghiên cứu đoạt Giải thưởng Nhân tài đất Việt vừa qua đang đi đúng quỹ đạo cuộc cách mạng công nghiệp 4.0. Nhóm nghiên cứu Vbee cho biết, sẽ tiếp tục hoàn thiện lõi tổng hợp tiếng nói Vbee, trong đó tập trung cải tiến chất lượng giọng đọc để tự nhiên hơn, gần gũi hơn với con người, đa dạng hóa hơn nữa giọng đọc và nói thuộc các lứa tuổi và các vùng miền trên cả nước. Ngoài ra, coi trọng việc chuẩn hóa cách đọc các chữ viết tắt, tên nước ngoài trong các văn bản theo yêu cầu.

Linh Trang