Trang chủ Tin tức Thế giới ChatGPT có mặt ở khắp mọi nơi, nhưng nó thật sự đến...

ChatGPT có mặt ở khắp mọi nơi, nhưng nó thật sự đến từ đâu?

Thành công đột phá của ChatGPT chỉ đến sau một đêm nhưng nó được xây dựng dựa trên nhiều thập kỷ nghiên cứu.

ChatGPT, một chatbot tiên tiến do OpenAI, một công ty công nghệ tại San Francisco (Mỹ) phát triển, đã nhanh chóng trở nên phổ biến ngay sau khi ra mắt vào cuối tháng 11-2022. Chỉ trong vòng hai tháng, công cụ này đã thu hút được 100 triệu người dùng, đánh dấu một tốc độ phát triển chưa từng có trên Internet.

Sự thành công này càng được củng cố khi OpenAI hợp tác với Microsoft trong một thỏa thuận trị giá 10 tỉ USD, đưa công nghệ này vào các sản phẩm như Office và Bing. Đáp lại, Google đã đẩy nhanh việc phát triển chatbot riêng dựa trên mô hình ngôn ngữ lớn PaLM để không bị tụt hậu trong cuộc đua về AI. ChatGPT hiện tại không chỉ xuất hiện trong các cuộc trò chuyện trên WhatsApp mà còn trong nhiều ứng dụng khác.

Nhưng sự thành công của ChatGPT không phải tự nhiên mà có, mà đó là thành quả của việc xây dựng và nghiên cứu trong nhiều năm.

 ChatGPT đã có một chặng đường dài phát triển. Ảnh minh họa ChatGPT đã có một chặng đường dài phát triển. Ảnh minh họa

Thập niên 1980-1990: Mạng thần kinh hồi quy (Recurrent Neural Networks – RNN)

Mô hình ngôn ngữ lớn (Large language model – LLM) là một loại mạng lưới thần kinh đã được đào tạo trên rất nhiều văn bản. Vì văn bản được tạo thành từ các chuỗi chữ cái và từ có độ dài khác nhau nên mô hình ngôn ngữ yêu cầu một loại mạng lưới thần kinh có thể hiểu được loại dữ liệu đó. RNN được phát minh vào những năm 1980, có thể xử lý các chuỗi từ, nhưng chúng được đào tạo chậm và có thể quên các từ trước đó trong một chuỗi.

Năm 1997, các nhà khoa học máy tính Sepp Hochreiter và Jürgen Schmidhuber đã khắc phục điều này bằng cách phát minh ra mạng LSTM (Long Short-Term Memory), mạng thần kinh hồi quy với các thành phần đặc biệt cho phép lưu giữ dữ liệu đầu vào lâu hơn. LSTM có thể xử lý các chuỗi văn bản dài vài trăm từ, nhưng kỹ năng ngôn ngữ còn hạn chế.

2017: Transformers

Bước đột phá đằng sau thế hệ mô hình ngôn ngữ lớn ngày nay xuất hiện khi một nhóm các nhà nghiên cứu của Google phát minh ra Transformers, một loại mạng thần kinh có thể theo dõi vị trí mỗi từ hoặc cụm từ xuất hiện theo một chuỗi.

Nghĩa của từ thường phụ thuộc vào nghĩa của các từ khác đứng trước hoặc sau. Bằng cách theo dõi thông tin theo ngữ cảnh này, Transformers có thể xử lý các chuỗi văn bản dài hơn và nắm bắt ý nghĩa của từ một cách chính xác hơn.

 Transformers đôi khi được gọi là mô hình nền tảng, được sử dụng cùng với nhiều nguồn dữ liệu cho nhiều ứng dụng. Ảnh: NVIDIA

Transformers đôi khi được gọi là mô hình nền tảng, được sử dụng cùng với nhiều nguồn dữ liệu cho nhiều ứng dụng. Ảnh: NVIDIA

2018-2019: GPT và GPT-2

Hai mô hình ngôn ngữ lớn đầu tiên của OpenAI chỉ cách nhau vài tháng. Công ty muốn phát triển AI đa năng và tin rằng các mô hình ngôn ngữ lớn là bước quan trọng hướng tới mục tiêu đó. GPT (viết tắt của Generative Pre-training Transformer) đã dẫn đầu, đánh bại các tiêu chuẩn tiên tiến nhất trong việc xử lý ngôn ngữ tự nhiên vào thời điểm đó.

GPT kết hợp Transformers với học tập không giám sát, một cách để đào tạo các mô hình học máy trên dữ liệu (trong trường hợp này là rất nhiều văn bản) chưa được chú thích trước. Điều này cho phép phần mềm tự tìm ra các mẫu trong dữ liệu mà không cần phải cho biết nó đang xem gì. Nhiều thành công trước đây trong học máy dựa vào học tập có giám sát và dữ liệu có chú thích, nhưng việc ghi nhãn dữ liệu bằng tay tương đối chậm, hạn chế kích thước của tập dữ liệu có sẵn để đào tạo.

2020: GPT-3

GPT-2 rất ấn tượng, nhưng phiên bản tiếp theo của OpenAI, GPT-3 đã khiến người ta phải há hốc mồm. Khả năng tạo ra văn bản giống con người của nó là một bước tiến lớn. GPT-3 có thể trả lời các câu hỏi, tóm tắt tài liệu, tạo câu chuyện theo nhiều phong cách khác nhau, dịch giữa tiếng Anh, tiếng Pháp, tiếng Tây Ban Nha và tiếng Nhật…

Một trong những điểm đáng chú ý nhất là lợi ích của GPT-3 đến từ việc phát triển các kỹ thuật hiện có thay vì phát minh ra các kỹ thuật mới. GPT-3 có 175 tỉ tham số (các giá trị trong mạng được điều chỉnh trong quá trình đào tạo), so với 1,5 tỉ của GPT-2.

Nhưng đào tạo văn bản lấy từ Internet lại làm nảy sinh thêm những vấn đề mới, đặc biệt là thông tin sai lệch.

Tháng 1 năm 2022: InstructGPT

OpenAI đã cố gắng giảm lượng thông tin sai lệch và văn bản xúc phạm mà GPT-3 tạo ra bằng cách sử dụng học tăng cường để huấn luyện một phiên bản của mô hình theo sở thích của người thử nghiệm (một kỹ thuật được gọi là học tăng cường từ phản hồi của con người, hay RLHF).

Kết quả là InstructGPT làm theo hướng dẫn của người sử dụng tốt hơn, được gọi là “căn chỉnh” trong thuật ngữ AI và tạo ra ít ngôn ngữ xúc phạm hơn, ít thông tin sai lệch hơn và ít sai sót hơn về tổng thể. Nói tóm lại, InstructGPT ít tệ hại hơn, trừ khi nó được yêu cầu.

Tháng 5-7 năm 2022: OPT, BLOOM

Một trong những trở ngại phổ biến đối với các mô hình ngôn ngữ lớn là chi phí đào tạo chúng rất lớn, khiến các công ty hoặc phòng thí nghiệm nhỏ khó xây dựng được một mô hình. Điều này làm dấy lên mối lo ngại rằng AI đang được xây dựng bởi các nhóm công ty đằng sau những cánh cửa đóng kín, mà không có sự giám sát thích hợp và không có ý kiến đóng góp của cộng đồng nghiên cứu.

Đáp lại, một số dự án hợp tác đã phát triển các mô hình ngôn ngữ lớn và phát hành chúng miễn phí cho bất kỳ nhà nghiên cứu nào muốn nghiên cứu và cải tiến công nghệ. Cụ thể, Meta đã xây dựng và tặng OPT, một bản tái thiết của GPT-3. Tương tự, tổ chức Hugging Face đã tập hợp hơn 1.000 nhà nghiên cứu từ khắp nơi trên thế giới để phát triển BLOOM AI.

Mô hình này được phát triển dựa trên nguyên tắc cộng tác mở, nơi dữ liệu, mã nguồn và kết quả nghiên cứu đều được chia sẻ công khai, cho phép các nhà nghiên cứu và phát triển từ khắp nơi trên thế giới cùng nhau cải thiện và áp dụng mô hình này vào các ứng dụng thực tế.

Tháng 12 năm 2022: ChatGPT

Ngay cả OpenAI cũng bị ấn tượng bởi cách ChatGPT được đón nhận. Giống như InstructGPT, ChatGPT đã được đào tạo bằng cách sử dụng phương pháp học tăng cường dựa trên phản hồi từ những người thử nghiệm.

 ChatGPT ngày nay có mặt ở khắp mọi nơi. Ảnh: TIỂU MINH

ChatGPT ngày nay có mặt ở khắp mọi nơi. Ảnh: TIỂU MINH

Sử dụng AI có trách nhiệm

Không hẳn tất cả các thông tin do ChatGPT đều chính xác hoàn toàn. Theo đó, các mô hình ngôn ngữ AI hoạt động bằng cách dự đoán từ tiếp theo nhưng chúng không có kiến thức về ý nghĩa hoặc ngữ cảnh, điều đó có nghĩa là mọi nội dung do các công cụ AI tạo ra đều cần phải được kiểm tra kỹ lưỡng.

Theo kynguyenso

https://kynguyenso.plo.vn/chatgpt-co-mat-o-khap-moi-noi-nhung-no-that-su-den-tu-dau-post778766.html

CÁC TIN KHÁC

Luật sư, Doanh nhân Phạm Hồng Điệp lập cú đúp Kỷ lục Việt Nam và Kỷ lục Thế giới với hàng trăm bài thơ...

(Kyluc.vn - WorldKings.org) Vào tối ngày 28/04/2024, trong khuôn khổ Chương trình sử thi nghệ thuật “Khát vọng truyền nhân” được tổ chức tại Văn phòng Shinec, KCN Nam Cầu Kiền, TP. Hải Phòng, Luật sư,Doanh nhân Phạm Hồng Điệp đã đón nhận cùng lúc 02 Kỷ lục Việt Nam và 01 Kỷ lục Thế giới. Ông là tác giả của 143 bài thơ, trong đó, có 125 bài được nhiều nhạc sĩ phổ nhạc theo đa dạng thể loại mang âm hưởng truyền thống như Dân ca, Chèo, Xẩm… bên cạnh những dòng nhạc hiện đại như rap, pop...

Công ty CP Shinec lập Kỷ lục Việt Nam với khu công nghiệp đầu tiên xây dựng Không gian Văn hóa về Đại tướng...

(kyluc.vn) Vào tối ngày 28/04/2024, trong khuôn khổ Chương trình Sử thi Nghệ thuật với chủ đề “Khát vọng Truyền nhân” được tổ chức tại Văn phòng Công ty Cổ phần Shinec, Khu công nghiệp Nam Cầu Kiền, TP.Hải Phòng, Công ty Cổ phần Shinec đã chính thức đón nhận Kỷ lục Việt Nam với “Khu công nghiệp đầu tiên tại Việt Nam xây dựng Không gian Văn hóa về Đại tướng Võ Nguyên Giáp.”

Thưởng thức đặc sản chả mực Hạ Long 200kg của Hộ kinh doanh Hải sản Mạnh Hà Hạ Long vừa được xác lập Kỷ...

kyluc.vn) Vào chiều ngày 27/4/2024, tại công viên Đại Dương, thành phố Hạ Long (tỉnh Quảng Ninh) đã diễn ra Lễ hội bia và Chả mực Hạ Long 2024. Cũng trong dịp này, Tổ chức Kỷ lục Việt Nam đã trao Kỷ lục “Mô hình chả mực Hạ Long hình tròn lớn nhất Việt Nam” đến Hộ kinh doanh Hải sản Mạnh Hà Hạ Long.

TOP 100 Hồng bảo Kỷ lục Thế giới tại Việt Nam (P.56) Dinh thự Công tử Bạc Liêu (Bạc Liêu): Kiến trúc bề thế...

(kyluc.vn) Nhà công tử Bạc Liêu tọa lạc ngay trung tâm thành phố Bạc Liêu. Ngôi nhà nổi bật giữa vùng với sự bề thế, mang phong cách kiến trúc phương Tây sang trọng vượt thời gian. Đây cũng là một địa điểm văn hóa, gắn liền với nhiều giai thoại và những câu chuyện truyền đời về cuộc sống của thiếu gia bậc nhất Lục tỉnh miền Tây những năm 1919.

Tổ chức thành công Lễ giỗ Tổ Hùng Vương lần thứ 6 tại Nhật Bản, Hiệp hội Người Việt Nam vùng Kansai được vinh...

(Vietworld.world) - Ngày 27/4 tại Công viên thành phố Osaka, Nhật Bản, Hiệp hội người Việt Nam vùng Kansai đã tổ chức long trọng Lễ giỗ tổ Hùng Vương lần thứ 6. Tại sự kiện này, Hiệp hội người Việt Nam vùng Kansai cũng đã vinh dự đón nhận Kỷ lục Người Việt toàn cầu.

[WOWTIMES – VIETKINGS] Đại học Dược Hà Nội (1902-2024) – Chiếc nôi đào tạo Dược sĩ hàng đầu cả nước – Top 100 đơn...

(nienlich.vn) Trường Đại học Dược Hà Nội tiền thân từ Trường thuốc Đông Dương, trải qua 122 năm cùng với nhiều thăng trầm lịch sử dân tộc, ngôi trường danh giá này tiếp tục là chiếc nôi đào tạo dược sĩ hàng đầu Việt Nam, đóng góp nhiều thành tích lớn vào sự phát triển y tế nước nhà.

Bài viết nổi bật

Đại học Sư phạm TP.HCM ‘bắt tay’ doanh nghiệp công nghệ Việt thúc đẩy chuyển đổi số

Theo hợp tác mới ký kết với Viettel Solutions, Đại học Sư phạm TP.HCM sẽ cùng doanh nghiệp này xây dựng các giải pháp công nghệ trong giáo dục tập trung vào 4 nội dung chính.

Nhóm sinh viên trường ĐH Ngoại thương giành giải ‘Olympic Kinh tế lượng và ứng dụng’

Ngày 12/6, tại Học viện Tài chính diễn ra Chung khảo Hội thi khoa học sinh viên toàn quốc 'Olympic Kinh tế lượng và ứng dụng' lần thứ VII, năm 2022. Ban Giám khảo đã chọn ra nhóm sinh viên ĐH Ngoại thương TP. Hồ Chí Minh giành giải Đặc biệt.

Bài viết mới nhất

Luật sư, Doanh nhân Phạm Hồng Điệp lập cú đúp Kỷ lục Việt Nam và Kỷ lục Thế giới với hàng trăm bài thơ chủ đề quê hương đất nước được phổ nhạc

(Kyluc.vn - WorldKings.org) Vào tối ngày 28/04/2024, trong khuôn khổ Chương trình sử thi nghệ thuật “Khát vọng truyền nhân” được tổ chức tại Văn phòng Shinec, KCN Nam Cầu Kiền, TP. Hải Phòng, Luật sư,Doanh nhân Phạm Hồng Điệp đã đón nhận cùng lúc 02 Kỷ lục Việt Nam và 01 Kỷ lục Thế giới. Ông là tác giả của 143 bài thơ, trong đó, có 125 bài được nhiều nhạc sĩ phổ nhạc theo đa dạng thể loại mang âm hưởng truyền thống như Dân ca, Chèo, Xẩm… bên cạnh những dòng nhạc hiện đại như rap, pop...

Công ty CP Shinec lập Kỷ lục Việt Nam với khu công nghiệp đầu tiên xây dựng Không gian Văn hóa về Đại tướng Võ Nguyên Giáp

(kyluc.vn) Vào tối ngày 28/04/2024, trong khuôn khổ Chương trình Sử thi Nghệ thuật với chủ đề “Khát vọng Truyền nhân” được tổ chức tại Văn phòng Công ty Cổ phần Shinec, Khu công nghiệp Nam Cầu Kiền, TP.Hải Phòng, Công ty Cổ phần Shinec đã chính thức đón nhận Kỷ lục Việt Nam với “Khu công nghiệp đầu tiên tại Việt Nam xây dựng Không gian Văn hóa về Đại tướng Võ Nguyên Giáp.”

Thưởng thức đặc sản chả mực Hạ Long 200kg của Hộ kinh doanh Hải sản Mạnh Hà Hạ Long vừa được xác lập Kỷ lục quốc gia

kyluc.vn) Vào chiều ngày 27/4/2024, tại công viên Đại Dương, thành phố Hạ Long (tỉnh Quảng Ninh) đã diễn ra Lễ hội bia và Chả mực Hạ Long 2024. Cũng trong dịp này, Tổ chức Kỷ lục Việt Nam đã trao Kỷ lục “Mô hình chả mực Hạ Long hình tròn lớn nhất Việt Nam” đến Hộ kinh doanh Hải sản Mạnh Hà Hạ Long.

TOP 100 Hồng bảo Kỷ lục Thế giới tại Việt Nam (P.56) Dinh thự Công tử Bạc Liêu (Bạc Liêu): Kiến trúc bề thế vượt thời gian – [VIETKINGS-TOPPLUS đề cử]

(kyluc.vn) Nhà công tử Bạc Liêu tọa lạc ngay trung tâm thành phố Bạc Liêu. Ngôi nhà nổi bật giữa vùng với sự bề thế, mang phong cách kiến trúc phương Tây sang trọng vượt thời gian. Đây cũng là một địa điểm văn hóa, gắn liền với nhiều giai thoại và những câu chuyện truyền đời về cuộc sống của thiếu gia bậc nhất Lục tỉnh miền Tây những năm 1919.

Tổ chức thành công Lễ giỗ Tổ Hùng Vương lần thứ 6 tại Nhật Bản, Hiệp hội Người Việt Nam vùng Kansai được vinh danh Kỷ lục Người Việt toàn cầu

(Vietworld.world) - Ngày 27/4 tại Công viên thành phố Osaka, Nhật Bản, Hiệp hội người Việt Nam vùng Kansai đã tổ chức long trọng Lễ giỗ tổ Hùng Vương lần thứ 6. Tại sự kiện này, Hiệp hội người Việt Nam vùng Kansai cũng đã vinh dự đón nhận Kỷ lục Người Việt toàn cầu.

[WOWTIMES – VIETKINGS] Đại học Dược Hà Nội (1902-2024) – Chiếc nôi đào tạo Dược sĩ hàng đầu cả nước – Top 100 đơn vị trên 100 tuổi còn hoạt động tại Việt Nam 2024 – P.14

(nienlich.vn) Trường Đại học Dược Hà Nội tiền thân từ Trường thuốc Đông Dương, trải qua 122 năm cùng với nhiều thăng trầm lịch sử dân tộc, ngôi trường danh giá này tiếp tục là chiếc nôi đào tạo dược sĩ hàng đầu Việt Nam, đóng góp nhiều thành tích lớn vào sự phát triển y tế nước nhà.