Máy móc hiểu con người mà không cần nghe giọng nói
Hai nghiên cứu đã chứng minh máy móc có thể hiểu những gì con người nói mà không cần nghe giọng nói của họ.
Trí tuệ nhân tạo hơn hẳn con người trong nhận dạng ngôn ngữ từ tín hiệu môi. Ảnh: MIT Technology Review. |
Hiểu từ ngữ từ cách ra hiệu môi là một bài toán khó,áymóchiểuconngườimàkhôngcầnnghegiọngnókết quả bóng đá việt nam hôm nay phụ thuộc hoàn cảnh và khả năng thông hiểu ngôn ngữ thông qua tín hiệu thị giác. Tuy nhiên, các nhà nghiên cứu đã chứng minh rằng máy móc có thể nhận dạng ngôn ngữ từ một đoạn video câm tốt hơn cả những người hiểu cách ra hiệu môi chuyên nghiệp.
Nhóm nghiên cứu thuộc ngành Khoa học máy tính của đại học Oxford đã phát triển hệ thống trí tuệ nhân tạo mang tên LipNet. Hệ thống được xây dựng trên cơ sở dữ liệu GRID, tạo nên từ một loạt clip trực tiếp về những người đang đọc các mẫu câu đơn giản.
Nhóm đã sử dụng dữ liệu này để phát triển một hệ thống nơ-ron công nghệ nhận diện ngôn ngữ. Dù hệ thống nhận diện sai lệch từ ngữ nhiều lần, quá trình học nhằm liên kết thông tin đến giải thích những gì đang được nói đã diễn ra, bởi lẽ tín hiệu môi luôn ít hơn số âm thanh mà chúng thể hiện.
Từ đây, máy móc bắt đầu xem xét toàn bộ đoạn video, phát triển khả năng hiểu đoạn văn từ các câu được phân tích.
Khi thử nghiệm, hệ thống có thể nhận diện chính xác đến 93,4%. Trong khi đó, những tình nguyện viên được yêu cầu đọc tín hiệu môi trong bài tập này đoán đúng chỉ 52,3% số từ.
Bên cạnh đó, theo tờ New Scientist, một nhóm khác thuộc ngành Khoa học kĩ thuật của đại học Oxford, làm việc với Google DeepMind, đã nghiên cứu vấn đề với một bài tập khó hơn về ngôn ngữ. Thay vì dùng cơ sở dữ liệu đơn giản và nhất quán như GRID, nhóm này dùng đến 100.000 video ở cấp độ từ ngữ rộng và phát âm phức tạp từ đài BBC.
Với phương pháp tương tự, nhóm từ Oxford và DeepMind đã xây dựng một cỗ máy với khả năng nhận diện đúng 46,8% tất cả từ ngữ. Kết quả này cho thấy chúng hoạt động tốt hơn cả con người với chỉ 12,4% từ đúng.
Gác lại những khác biệt, cả hai thí nghiệm chứng tỏ trí tuệ nhân tạo hơn hẳn con người trong nhận dạng ngôn ngữ từ tín hiệu môi, và không lâu nữa, chúng ta rồi sẽ chứng kiến những ứng dụng đầy tiềm năng cho lĩnh vực này.
Trong tương lai, biết đâu Skype cũng sẽ áp dụng chúng bằng cách ghi lại lời thoại, khi người gọi đang ở một chốn ồn ào, hoặc người nghe gặp khó khăn để giữ smartphone và lắng nghe trọn vẹn đầu dây bên kia?
Theo Zing/New Scientist
(责任编辑:Kinh doanh)
- Nhận định, soi kèo Alaves vs Celta Vigo, 3h00 ngày 28/1: Ưu thế sân nhà
- Nhận định, soi kèo Bryne vs Aalesund, 00h00 ngày 23/5: Cửa trên đáng tin
- Soi kèo phạt góc Barcelona vs Dynamo Kyiv, 23h45 ngày 20/10
- Soi kèo phạt góc Nagoya Grampus vs FC Tokyo, 17h00 ngày 6/10
- Nhận định, soi kèo Persikas vs Persipa Pati, 15h00 ngày 28/1: Tin vào chủ nhà
- Soi kèo phạt góc PSG vs Angers, 2h ngày 16/10
- Soi kèo phạt góc Bologna vs Lazio, 17h30 ngày 3/10
- Soi kèo phạt góc Việt Nam vs Oman, 23h ngày 12/10
- Soi kèo góc Tottenham vs Leicester, 21h00 ngày 26/1
- Soi kèo phạt góc PSG vs Angers, 2h ngày 16/10
- Soi kèo phạt góc Club Brugge vs Man City, 23h45 ngày 19/10
- Nhận định, soi kèo Viktoria Plzen vs Sparta Prague, 23h00 ngày 22/5: Hy vọng cho chủ nhà
- Nhận định, soi kèo Persiku Kudus vs Persewar Waropen, 15h00 ngày 28/1: Khách ‘tạch’
- Soi kèo phạt góc MU vs Atalanta, 2h ngày 21/10
- Nhận định, soi kèo Persijap Jepara vs Persela Lamongan, 19h00 ngày 27/1: Trận đấu tẻ nhạt
- Soi kèo phạt góc Queretaro vs Tijuana, 9h ngày 15/10
- Soi kèo phạt góc Chelsea vs Southampton, 21h ngày 2/10
- Soi kèo phạt góc Celtic vs Ferencvaros, 21h30 ngày 19/10
- Nhận định, soi kèo Hoffenheim vs Eintracht Frankfurt, 21h30 ngày 26/1: Tin vào chủ nhà
- Nhận định, soi kèo Levski Krumovgrad vs Levski Sofia, 20h00 ngày 22/05: Đôi bên hài lòng