Trang chủ Ý tưởng sáng tạo toàn cầu 24h Top Ý Tưởng Sáng Tạo Thế Giới Năm 2023 - Đột phá...

Top Ý Tưởng Sáng Tạo Thế Giới Năm 2023 – Đột phá trong khả năng đọc suy nghĩ: Một công cụ AI có thể tái tạo lại hình ảnh con người nhìn thấy

Dùng một mô hình AI đang nổi tiếng hiện nay, các nhà khoa học có thể tái tạo lại hình ảnh con người nhìn thấy bằng cách quét hoạt động não.

Quét não bộ của con người và nhận biết được cách đôi mắt mọi người nhìn thấy thế giới xung quanh như thế nào vốn là mơ ước bao lâu nay của những nhà khoa học thần kinh. Nắm được các hiểu biết này, những nhà khoa học có thể đưa ra các giải pháp cải thiện khả năng giao tiếp của người khuyết tật đối với người khác cũng như thế giới xung quanh.

Giờ đây ước mơ đó đang dần trở thành hiện thực nhờ vào các bước tiến trong công nghệ AI. Vào tháng 10 năm ngoái, các phần mềm AI đã giúp các nhà khoa học quét hình ảnh não và tái tạo thành dạng văn bản, giờ đây các mô hình AI ngôn ngữ tự nhiên còn giúp tái tạo lại cả các hình ảnh mà đôi mắt con người nhìn thấy.

Mô hình AI trợ giúp cho các nhà khoa học lần này đến từ thuật toán của Stable Diffusion, công cụ AI nổi tiếng với khả năng sản sinh ra các hình ảnh từ những lời gợi ý của người dùng – tương tự như các công cụ AI khác ví dụ như Dall-E 2 và Midjourney.

Đột phá trong khả năng đọc suy nghĩ: Một công cụ AI có thể tái tạo lại hình ảnh con người nhìn thấy - Ảnh 1.

Ảnh Internet

Huấn luyện bằng các dữ liệu văn bản thu được từ quét não

Trong nghiên cứu của mình, dựa vào hệ thống của Stable Diffusion, các nhà thần kinh học của trường Đại học Osaka, Nhật Bản huấn luyện bổ sung cho dữ liệu của nó, liên kết các mô tả bằng văn bản về hàng nghìn bức ảnh do những người tham gia nghiên cứu quét não tạo ra khi họ được quan sát chúng.

Điều đặc biệt ở Stable Diffusion – cũng như các mô hình AI ngôn ngữ lớn hiện nay – là nó có khả năng học tập rất nhanh dù chỉ được đào tạo trên một số ít dữ liệu. Đây là một bước tiến dài đối với quá trình huấn luyện AI khi giúp các nhà nghiên cứu tiết kiệm đáng kể thời gian và công sức cho quá trình này. Bên cạnh đó, nhà thần kinh học Ariel Goldstein cho rằng, đây cũng là một cách tiếp cận mới khi có thể kết hợp cả thông tin bằng văn bản và hình ảnh để “giải mã bộ não”.

Để thu thập được phần mô tả bằng văn bản của bộ não đối với hình ảnh mà đôi mắt nhìn thấy, thay vì gắn các điện cực vào não, giờ đây các nhà nghiên cứu sử dụng máy chụp cộng hưởng từ chức năng (fMRI: functional magnetic resonance imaging) để quét và phát hiện các thay đổi trong lưu lượng máu đến các vùng hoạt động của não.

Đột phá trong khả năng đọc suy nghĩ: Một công cụ AI có thể tái tạo lại hình ảnh con người nhìn thấy - Ảnh 2.

Thuật toán AI của Stable Diffusion có thể tái tạo lại các hình ảnh con người nhìn thấy khi quét não. Ảnh Science

Khi mọi người xem một bức ảnh nào đó, thùy thái dương sẽ đóng vai trò đăng ký thông tin về nội dung bức ảnh (con người, vật thể hay phong cảnh) trong khi thùy chẩm sẽ đóng vai trò đăng ký thông tin về bố cục và phối cảnh, ví dụ tỷ lệ hoặc vị trí của nội dung. Các thông tin này sẽ được máy fMRI ghi lại khi nó theo dõi các hoạt động đỉnh của não.

Từ thông tin mô tả bằng văn bản này, thuật toán AI của Stable Diffusion có thể chuyển hóa thành một hình ảnh mô phỏng – tương tự như cách nó đang tạo ra các hình ảnh từ những lời gợi ý của người dùng. Trong nghiên cứu này, các nhà khoa học sử dụng bộ dữ liệu trực tuyến do trường đại học Minnesota cung cấp để huấn luyện cho Stable Diffusion. Bộ dữ liệu này chứa thông tin quét não của 4 người tham gia thí nghiệm, mỗi người được xem 10.000 hình ảnh.

Đột phá trong khả năng đọc suy nghĩ: Một công cụ AI có thể tái tạo lại hình ảnh con người nhìn thấy - Ảnh 3.

Ngay cả các nhà nghiên cứu cũng phải ngạc nhiên về hiệu quả thu được. Ảnh Science

Ban đầu mỗi hình ảnh do AI tạo ra đều có nhiễu và sau đó chúng được thay thế bằng các đường nét có thể phân biệt được khi thuật toán của Stable Diffusion so sánh hình ảnh vừa tạo ra với các mô hình trong dữ liệu huấn luyện của nó. Nhờ vậy, hệ thống này có thể tạo ra một hình ảnh miêu tả gần đúng nội dung, bố cục và phối cảnh của hình ảnh mà người tham gia thí nghiệm đã xem.

Tuy nhiên, các nhà nghiên cứu nhận thấy thuật toán lại gặp khó khăn trong việc nhận biết đối tượng trong ảnh, ví dụ, nó không tạo ra được hình ảnh tháp đồng hồ như trong bức ảnh, thay vào đó nó tạo ra các hình dáng được trừu tượng hóa. Vấn đề này có thể được giải quyết bằng cách sử dụng các bộ dữ liệu huấn luyện lớn hơn, tuy nhiên, các nhà nghiên cứu Nhật Bản cho biết dữ liệu từ máy fMRI quá hạn chế so với yêu cầu này.

Thay vào đó, các nhà nghiên cứu giải quyết thách thức này bằng cách bổ sung thêm các từ khóa trong phần chú thích về hình ảnh trong bộ dữ liệu fMRI của trường Minnesota. Ví dụ nếu trong một bức ảnh có chứa tháp đồng hồ, phần thông tin quét não sẽ được liên kết với đối tượng đó và sau đó dữ liệu này sẽ được nạp vào hệ thống huấn luyện của Stable Diffusion.

Đột phá trong khả năng đọc suy nghĩ: Một công cụ AI có thể tái tạo lại hình ảnh con người nhìn thấy - Ảnh 4.

Độ chính xác của hình ảnh tái tạo được tăng dần sau mỗi lần tinh chỉnh. Ảnh Science

Điều quan trọng hơn là thuật toán của Stable Diffusion không trực tiếp tạo ra hình ảnh từ lời nhắc trong dữ liệu văn bản – nó chỉ có thể nhận ra sự xuất hiện của đối tượng trong hình ảnh nếu mô hình hoạt động của não khớp với mẫu mô hình trong dữ liệu huấn luyện. Do vậy, thuật toán mới chỉ tái tạo lại các đối tượng xuất hiện trong những hình ảnh huấn luyện, thay vì các hình ảnh mới.

Để vượt qua thách thức này, những người tham gia thí nghiệm được quét não bổ sung khi xem các hình ảnh riêng biệt về đồng hồ, gấu đồ chơi, máy bay và tàu hỏa. Bằng cách so sánh các dữ liệu quét riêng biệt đó với mẫu hình ảnh xuất hiện trong bộ dữ liệu huấn luyện, thuật toán AI có thể tạo ra những hình ảnh chính xác hơn, thuyết phục hơn ngay cả khi gặp phải các hình ảnh mới. Kết quả thu được từ phương pháp này thật sự ấn tượng.

Tuy nhiên, hiện tại hệ thống mới chỉ thử nghiệm với dữ liệu quét não của 4 người tham gia thí nghiệm, do vậy, để nhận diện được hình ảnh của mà những người khác nhìn thấy, hệ thống này cần phải được huấn luyện lại. Vì vậy sẽ phải mất thêm một thời gian nữa để hệ thống này có thể được áp dụng phổ biến.

Khi công nghệ này được phát triển đến mức độ cao hơn, các nhà nghiên cứu kỳ vọng rằng có thể ứng dụng nó vào việc khám phá cách các loài vật nhận thức về thế giới và thậm chí một ngày nào đó có thể ghi lại cả giấc mơ của con người cũng như hỗ trợ giao tiếp với người bị liệt.

Theo Thể Thao Văn Hóa

CÁC TIN KHÁC

Ra mắt “pin” muối nóng chảy khổng lồ đầu tiên trên thế giới

Cơ sở lưu trữ năng lượng xanh bằng muối nóng chảy mới khánh thành ở Đan Mạch được ví như viên pin khổng lồ và cực kỳ hiệu quả.

AI tạo ra “bản sao kỹ thuật số” của Trái đất giúp dự báo thiên tai với tốc độ siêu nhanh

Các nhà khoa học đã tạo ra một "bản sao kỹ thuật số" của Trái đất sử dụng trí tuệ nhân tạo (AI) để dự đoán sớm thiên tai, giúp hạn chế hậu quả nghiêm trọng của những thảm họa khí hậu có nguy cơ xảy ra trong tương lai.

Công cụ AI phát hiện 3 loại ung thư trong vài phút chỉ bằng 1 giọt máu khô

Các nhà khoa học Trung Quốc đã phát triển, thử nghiêm một công cụ trí tuệ nhân tạo (AI) để phát hiện chính xác và nhanh chóng 3 loại ung thư nguy hiểm (ung thư tuyến tụy, dạ dày và đại trực tràng) chỉ bằng một giọt máu khô.

‘Hành lang thông minh’ giúp giảm tắc nghẽn, tăng cường an toàn giao thông

Ùn tắc giao thông là một thách thức lớn đối với các thành phố, gây ảnh hưởng nghiêm trọng đến kinh tế, sức khỏe và sự an toàn của người dân. Các giải pháp quản lý giao thông hiện tại tối ưu hóa luồng giao thông nhưng thiếu sự kết nối với hành vi của người lái xe. Để khắc phục những hạn chế này và giảm thiểu tác động của giao thông, công nghệ trí tuệ nhân tạo (AI), thuật toán học sâu và mô hình dự đoán khác được tận dụng để làm tăng mối liên kết giữa phương tiện và cơ sở hạ tầng đường bộ, giúp giảm thời gian di chuyển do tắc nghẽn giao thông.

Ấn Độ giới thiệu mũ bảo hiểm có điều hòa cho cảnh sát giao thông

Mới đây, các sở cảnh sát ở nhiều bang của Ấn Độ đã giới thiệu mũ bảo hiểm có điều hòa nhiệt độ cho cảnh sát giao thông, qua đó hỗ trợ lực lượng làm nhiệm vụ trên đường có thể thoải mái hơn trong bối cảnh nắng nóng đang hoành hành trên khắp đất nước.

Dùng AI cứu động vật hoang dã khỏi nguy cơ bị xe đụng

Hãng AFP giới thiệu nỗ lực dùng đến trí tuệ nhân tạo (AI) giải quyết tình trạng động vật hoang dã bị xe đụng chết tại Brazil của một sinh viên khoa học máy tính 25 tuổi.

Bài viết nổi bật

Đại học Sư phạm TP.HCM ‘bắt tay’ doanh nghiệp công nghệ Việt thúc đẩy chuyển đổi số

Theo hợp tác mới ký kết với Viettel Solutions, Đại học Sư phạm TP.HCM sẽ cùng doanh nghiệp này xây dựng các giải pháp công nghệ trong giáo dục tập trung vào 4 nội dung chính.

Nhóm sinh viên trường ĐH Ngoại thương giành giải ‘Olympic Kinh tế lượng và ứng dụng’

Ngày 12/6, tại Học viện Tài chính diễn ra Chung khảo Hội thi khoa học sinh viên toàn quốc 'Olympic Kinh tế lượng và ứng dụng' lần thứ VII, năm 2022. Ban Giám khảo đã chọn ra nhóm sinh viên ĐH Ngoại thương TP. Hồ Chí Minh giành giải Đặc biệt.

Bài viết mới nhất

Mr Đàm lập Kỷ lục với thành tích biểu diễn 18 mashup từ 62 ca khúc: “Phải tập trung cao độ, không được lơ mơ”

(Kyluc.vn) Vào tối ngày 04.5.2024 tại Trung tâm Hội nghị Thiskyhall Sala tại TP.Thủ Đức diễn ra liveshow "Ngày Em Thắp Sao Trời" của ca sĩ Đàm Vĩnh Hưng. Tại đây Mr.Đàm cùng các nghệ sĩ đã mang đến cho khán giả một bữa tiệc âm nhạc hoàng tráng. Đặc biệt với 18 bài mashup từ 62 ca khúc trữ tình nổi tiếng của làng nhạc Việt, ông hoàng của làng nhạc Việt đã thiết lập kỷ lục Việt Nam lần thứ 3 trong sự nghiệp âm nhạc của mình.

[WOWTIMES – VIETKINGS] Đại học Công nghiệp Hà Nội (1898-2024) – Truyền thống kỹ nghệ trăm năm – Top 100 đơn vị còn hoạt động tại Việt Nam

Trải qua gần 126 năm hình thành và phát triển, tính đến nay Đại học Công nghiệp Hà Nội đã và đang chứng minh được vị thế của mình trên con đường phát triển học thuật cũng như đào tạo nguồn chất lượng cao cho nước nhà trong hành trình công nghiệp hóa, hiện đại hóa.

TOP 5 khu chợ đặc trưng ba miền của Việt Nam được nhiều người biết đến – 50 TOP các điểm đến hấp dẫn của Việt Nam 2024 (P.10) – [VIETKINGS-TOPPLUS – Hành trình TOP Việt Nam]

(kyluc.vn) Không ai biết chính xác chợ đươc hình thành từ khi nào, có bao nhiêu cái chợ và bao nhiêu loại chợ búa khác nhau ở Việt Nam. Nhưng có một điều chắc chắn rằng chợ không chỉ nằm trong phạm trù kinh tế đơn thuần mà còn biểu hiện văn hóa Việt Nam một cách đậm nét.

TOP 100 Hồng bảo Kỷ lục Thế giới tại Việt Nam (P.61) Nhà trăm cột (Long An): Kiến trúc nhà Rường giữa miền Tây – [VIETKINGS-TOPPLUS đề cử]

(kyluc.vn) Ở tả ngạn sông Vàm Cỏ Đông, thuộc xã Long Hựu Đông, huyện Cần Đước, tỉnh Long An, nhà Trăm cột là công trình kiến trúc điêu khắc cổ xây dựng theo lối nhà Rường đặc trưng của xứ Huế. Trải qua hơn 100 năm, ngôi nhà vẫn được các hậu duệ của chủ nhân ngôi nhà gìn giữ qua nhiều thế hệ.

Việt Nam có 1 loại “nấm trường thọ” chứa hơn 400 dưỡng chất quý giá

Đây là một loại dược liệu quý giúp bồi bổ sức khỏe, ngăn ngừa một số loại bệnh và tăng cường tuổi thọ.

[WOWTIMES – VIETKINGS] Trường Đại học Điện lực (1898-2024) – Ngôi trường hàng đầu trong lĩnh vực năng lượng – Top 100 đơn vị trên 100 tuổi còn hoạt động tại Việt Nam 2024 – P.20

(nienlich.vn) Đại học Điện lực, thành lập năm 1898, là trường đại học công lập đa cấp, đa ngành có nhiệm vụ chủ yếu là đào tạo nguồn nhân lực có chất lượng cao cung cấp cho Ngành và phục vụ nhu cầu kinh tế xã hội đồng thời là một trung tâm nghiên cứu khoa học - công nghệ hàng đầu của Ngành.