Trang chủ Thế giới ý tưởng Ý tưởng ứng dụng Top Ý Tưởng Sáng Tạo Việt Nam 2022 - Dùng AI biến...

Top Ý Tưởng Sáng Tạo Việt Nam 2022 – Dùng AI biến giọng nói thành văn bản

Giải pháp Memobot chuyên chuyển đổi giọng nói thành văn bản sử dụng công nghệ AI để tạo ra văn bản chính xác.
Giải pháp chuyển đổi file ghi âm thành văn bản sử dụng trí tuệ nhân tạo (AI).
Giải pháp chuyển đổi file ghi âm thành văn bản sử dụng trí tuệ nhân tạo (AI).

Biến băng ghi âm thành văn bản, chỉnh sửa lỗi chính tả, xuất file hoàn chỉnh là sản phẩm của công nghệ AI do Công ty Cổ phần Giải pháp trí thông minh nhân tạo Việt Nam (VAIS) sáng tạo có tên Memobot.

Thay thế hoàn toàn ghi chép truyền thống

Xả băng ghi âm truyền thống là việc nghe và đánh máy, ghi chép thủ công lại tập tin ghi âm. Công việc ngồi nghe băng ghi âm hàng giờ và viết lại thành văn bản phức tạp và có nhiều điểm hạn chế: Tốn nhiều thời gian, thời lượng ghi âm dài gây khó khăn trong việc nghe lại các đoạn âm thanh từng phần của biên bản. Do vậy, việc ra một biên bản xả băng hoàn chỉnh mất nhiều thời gian, kéo theo các tiến độ công việc khác bị chậm trễ.

Ông Phạm Tấn Anh Vũ, thành viên phát triển Memobot, cho biết, trong các doanh nghiệp, công việc xả băng ghi âm ở các cuộc họp sẽ được nhóm thư ký xử lý. Khi đó, với tốc độ nói 100 – 250 từ/phút và tốc độ gõ 50 – 70 từ/phút sẽ tốn nhiều thời gian để ghi chép, chuyển đổi thành văn bản.

Sau đó là công đoạn rà soát lại nội dung, thư ký sẽ nghe toàn bộ file ghi âm kết hợp với dò văn bản một lần nữa để bảo đảm tính chính xác của văn bản chuyển đổi. Do mất nhiều thời gian và công đoạn, biên bản sẽ ra chậm, đôi khi cuộc họp chỉ 1 giờ nhưng 2 ngày sau mới có biên bản hoàn chỉnh.

Giải pháp Memobot chuyên chuyển đổi giọng nói thành văn bản sử dụng công nghệ AI để tạo ra văn bản chính xác. Giải pháp ứng dụng trong nhiều lĩnh vực như: Họp hành (lãnh đạo, thư ký ghi âm lại các buổi họp), phỏng vấn (nhà báo, luật sư, nhà tuyển dụng ghi âm lại các sự kiện, cuộc phỏng vấn), học tập (học sinh, sinh viên ghi âm lời thầy cô giảng bài), sáng tạo nội dung (người làm truyền thông YouTube/Podcasts ghi âm làm phụ đề video), sáng tác (nhà văn, nhà nghiên cứu ghi âm ngay khi vừa nảy ra ý tưởng).

Memobot đã đoạt giải Nhất hạng mục nhận dạng giọng nói với độ chính xác 95,2% tại cuộc thi Xử lý ngôn ngữ và giọng nói tiếng Việt 2019. Tại cuộc thi Startup Wheel 2022, ứng dụng Memobot là sản phẩm duy nhất nhận 2 giải thưởng quan trọng là giải Nhì và giải thưởng Dự án sáng tạo nhất.

Ngoài chức năng chuyển đổi giọng nói thành văn bản trong thời gian thực, Memobot còn cung cấp nhiều tính năng khác. Trực tiếp tham gia và ghi âm cuộc họp Meet, Zoom, Teams; Phân chia dữ liệu theo năm tháng và chủ đề; Tự động nhận biết và ngắt đoạn từng lời nói của nhiều người khác nhau; Hỗ trợ chuyển đổi các tệp âm thanh có định dạng khác nhau; Đồng bộ dữ liệu giữa điện thoại và website (memobot.io), có mặt ở cả hai phiên bản Android và iOS.

Tự động ngắt phân đoạn theo thời gian thực

Điểm nổi bật của Memobot là hỗ trợ tự động tạo phụ đề và ngắt đoạn từng lời của nhiều người khác nhau trong thời gian thực, giúp tiết kiệm tối đa thời gian xử lý băng ghi âm, trong khi xả băng ghi âm truyền thống phải nghe và viết lại thủ công, tự ngắt phân đoạn thời gian và phân biệt từng người nói. Bên cạnh đó,

Memobot cũng hỗ trợ đăng tải và xuất văn bản chuyển đổi ra các loại tệp có định dạng khác nhau, xử lý toàn bộ các công đoạn trên trong thời gian thực, chỉnh sửa nội dung văn bản trực tiếp kèm theo phân đoạn thời gian được thể hiện sẵn, từ nào sai thì chỉ cần gõ lại từ đó chứ không cần gõ lại toàn bộ nội dung.

Mọi thông tin file ghi âm và văn bản đều được lưu trữ trên phần mềm. Người dùng dễ dàng nắm bắt và chia sẻ cho người khác, do đó, các cá nhân và doanh nghiệp khác cũng có thể tiếp nhận thông tin từ dữ liệu đã được lưu trữ lại. Từ đó, doanh nghiệp, cá nhân giải quyết được vấn đề xả băng ghi âm, dễ dàng lưu trữ, phân loại các loại tập tin, dữ liệu.

Ông Phạm Tấn Anh Vũ cho biết, với ứng dụng này, người dùng có thể chỉnh sửa nội dung văn bản trực tiếp kèm theo phân đoạn thời gian được thể hiện sẵn, chỉ cần gõ lại từ mà Memobot nhận diện sai, không cần gõ lại toàn bộ nội dung. Ngoài ra người dùng có thể sửa trực tiếp vào văn bản nếu thấy phần dịch của Memobot chưa được chính xác hay muốn bổ sung nội dung mới khi phần thu âm trước đó chưa đề cập đến nội dung đó.

Để đánh dấu phần ghi âm, người dùng tô đen phần chữ trong văn bản, Memobot sẽ đồng bộ phần tô đen giống với phần ghi âm, khi đó chỉ cần nhấp vào phần chữ tô đen thì phần thu âm giọng nói sẽ tự động phát đến đoạn tương ứng với dòng chữ đó.

Sau khi kết thúc quá trình chuyển đổi file ghi âm, Memobot hỗ trợ tải bản ghi qua nhiều định dạng khác nhau từ tệp word (doc), tệp âm thanh (mp3), tệp văn bản (txt), tệp phụ đề (srt)… và chia sẻ trực tiếp bản ghi thông qua những ứng dụng khác nhau như Instagram, Facebook, Zalo, Gmail, Drive, Twitter….

Các doanh nghiệp, tổ chức, đơn vị, cá nhân có nhu cầu có thể liên hệ trực tiếp Công ty Cổ phần Giải pháp trí thông minh nhân tạo Việt Nam (VAIS) để dùng thử sản phẩm, hoặc liên hệ Trung tâm Thông tin và Thống kê Khoa học và Công nghệ (CESTI, thuộc Sở Khoa học và Công nghệ TPHCM) để được hỗ trợ tư vấn triển khai chuyển giao công nghệ.

Theo Giáo Dục Thời Đại

CÁC TIN KHÁC

Sinh viên biến phế thải thành vật liệu xây dựng

Nhóm sinh viên đã sử dụng các phế thải nông nghiệp (bã mía, rơm rạ...) và phế thải công nghiệp để chế tạo loại vật liệu mới thân thiện với môi trường.

Nhóm sinh viên Bách khoa chế robot bay tiếp cận vật thể để sửa chữa

UAV - Robot ứng dụng để khảo sát, quan trắc, bảo dưỡng, sửa chữa tại các công trình cao tầng như nhà máy, tháp truyền hình, cột điện gió...

Biến xơ mướp thành các sản phẩm có giá trị

Nhóm sinh viên Trường Đại học Công Thương TPHCM đã phát triển xơ mướp thành các sản phẩm đa dụng, trang trí vô cùng lạ mắt như túi xách, bông tắm...

Biến xơ mướp thành các sản phẩm có giá trị

Nhóm sinh viên Trường Đại học Công Thương TPHCM đã phát triển xơ mướp thành các sản phẩm đa dụng, trang trí vô cùng lạ mắt như túi xách, bông tắm...

Top Ý Tưởng Sáng Tạo Việt Nam 2023 – Chế phẩm xua đuổi côn trùng từ cây cỏ

Từ tinh dầu giổi chanh, tràm gió, bạc hà á, sả chanh... đã tạo ra chế phẩm xua đuổi côn trùng an toàn cho sức khỏe con người và môi trường.

Top Ý Tưởng Sáng Tạo Việt Nam 2023 – Xu hướng trải nghiệm tour ảo nở rộ khiến các ‘tín đồ’ du lịch say...

Công nghệ ngày càng phát triển, nhu cầu trải nghiệm du lịch số ngày càng tăng và các tour ảo cùng những tiện ích hiện đại được ưa chuộng nhiều hơn với trải nghiệm mới mẻ.

Bài viết nổi bật

Đại học Sư phạm TP.HCM ‘bắt tay’ doanh nghiệp công nghệ Việt thúc đẩy chuyển đổi số

Theo hợp tác mới ký kết với Viettel Solutions, Đại học Sư phạm TP.HCM sẽ cùng doanh nghiệp này xây dựng các giải pháp công nghệ trong giáo dục tập trung vào 4 nội dung chính.

Nhóm sinh viên trường ĐH Ngoại thương giành giải ‘Olympic Kinh tế lượng và ứng dụng’

Ngày 12/6, tại Học viện Tài chính diễn ra Chung khảo Hội thi khoa học sinh viên toàn quốc 'Olympic Kinh tế lượng và ứng dụng' lần thứ VII, năm 2022. Ban Giám khảo đã chọn ra nhóm sinh viên ĐH Ngoại thương TP. Hồ Chí Minh giành giải Đặc biệt.

Bài viết mới nhất

TOP 100 Hồng bảo Kỷ lục Thế giới tại Việt Nam (P.59) Đình Hàng Kênh (Hải Phòng): Ngôi đình cổ tạc gần 400 con rồng – [VIETKINGS-TOPPLUS đề cử]

(kyluc.vn) Đình Hàng Kênh được khởi dựng vào nửa cuối thế kỷ XVII, trải hơn 300 năm, đình vẫn được bảo lưu gần như nguyên vẹn công trình kiển trúc gỗ to lớn, bề thế, được lát ván sàn; trong đình còn bảo tổn được hàng trăm mảng chạm khắc gỗ tinh xáo, với đề tài chủ đạo long - phượng, Đã đưa Đình Hàng Kênh trở thành một bảo tàng nghệ thuật điêu khắc sống động, thu hút đông đảo du khách trong và ngoài nước đến tham quan, thưởng lãm.

Hé lộ sự tồn tại hành tinh thứ 9 trong Hệ Mặt trời chúng ta

Chúng ta biết rằng, có ít nhất 8 hành tinh đang tồn tại trong Hệ Mặt trời, nhưng có thể vẫn còn tồn tại những vật thể khác. Mới đây các nhà khoa học đã hé lộ thêm bằng chứng về hành tinh thứ 9.

Công ty khởi nghiệp Mỹ cấy ghép mắt khoa học cho người mù

Những người bị mù do bệnh viêm võng mạc sắc tố và bệnh thoái hóa điểm vàng khô do tuổi tác có hy vọng được nhìn thấy trở lại.

[WOWTIMES – VIETKINGS] Đại học Mỹ thuật Thành phố Hồ Chí Minh (1913-2024) – Chiếc nôi đào tạo nghệ sĩ hàng đầu cả nước – Top 100 đơn vị trên 100 tuổi còn hoạt động tại Việt Nam 2024 – P.18

Trường Đại học Mỹ thuật Thành phố Hồ Chí Minh, tiền thân là Trường vẽ Gia Định được thành lập ngày 1/9/1913, là một trong những trường mỹ thuật có truyền thống lâu đời ở Việt Nam.

Nhà khoa học kiếm tìm những bí ẩn trong lòng đất

PGS.TS Cao Đình Triều là một trong số ít những nhà khoa học, dành trọn tâm huyết, đam mê nghiên cứu địa vật lý suốt cả cuộc đời.

Nhà hát lớn Hải Phòng – TOP 5 sân khấu – nhà hát kịch lâu đời của Việt Nam thu hút nhiều khách tham quan (P.3) – [VIETKINGS-TOPPLUS – Hành trình TOP Việt Nam]

(kyluc.vn) Nhà hát lớn Hải Phòng là một trong những điểm đến thu hút du khách tham quan khi du lịch Hải Phòng. Với kiến trúc độc đáo, hài hòa giữa nét hiện đại và cổ kính, nhà hát là điểm đến lý tưởng cho những du khách yêu thích thưởng thức nghệ thuật và muốn khám phá vẻ đẹp văn hóa, lịch sử của vùng đất cảng.