Trang chủ Tin tức Thế giới Meta tiết lộ mô hình ngôn ngữ mới được thiết kế cho...

Meta tiết lộ mô hình ngôn ngữ mới được thiết kế cho cộng đồng nghiên cứu AI

Những gã khổng lồ công nghệ như Microsoft và Google, cùng với OpenAI đã và đang gây chú ý với những nghiên cứu và tiến bộ về AIcủa họ

Meta tiết lộ mô hình ngôn ngữ mới được thiết kế cho cộng đồng nghiên cứu AI (Ảnh: Tech Spot)

Meta tiết lộ mô hình ngôn ngữ mới được thiết kế cho cộng đồng nghiên cứu AI (Ảnh: Tech Spot)

Những gã khổng lồ công nghệ như Microsoft và Google, cùng với OpenAI đã và đang gây chú ý với những nghiên cứu và tiến bộ về AI sáng tạo của họ. Không chịu thua kém, Mark Zuckerberg và Meta đang phát triển một mô hình ngôn ngữ AI mới có tên LLaMA. Mô hình này được báo cáo là vượt trội so với GPT-3 trong hầu hết các điểm chuẩn.

Được công bố trong một bài đăng trên blog vào thứ Sáu, Mô hình ngôn ngữ lớn Meta AI (LLaMA) của Meta được thiết cho các nhóm nghiên cứu. Theo Meta, với kích thước chỉ bằng 10% của GPT-3 (Máy biến áp được đào tạo trước thế hệ thứ ba), mô hình LLaMA cung cấp một tài nguyên nhỏ nhưng hiệu suất cao có thể được tận dụng bởi ngay cả những nhóm nghiên cứu nhỏ nhất.

Kích thước mô hình này đảm bảo rằng các nhóm nhỏ với nguồn lực hạn chế vẫn có thể sử dụng mô hình và đóng góp vào những tiến bộ tổng thể của AI và học máy.

Cách tiếp cận của Meta với LLaMA khác biệt rõ rệt khi so sánh với ChatGPT của OpenAI, Bard của Google hoặc Prometheus của Microsoft. Công ty đang phát hành mô hình mới theo giấy phép phi thương mại, nhắc lại cam kết đã nêu về sự công bằng và minh bạch của AI. Truy cập cho các nhà nghiên cứu trong các tổ chức trên toàn chính phủ, học viện quan tâm đến việc tận dụng mô hình sẽ phải xin giấy phép và được cấp quyền truy cập.

Những nhà nghiên cứu nào xin được giấy phép thành công sẽ có quyền truy cập vào mô hình nền tảng nhỏ, dễ tiếp cận của LLaMA. Meta đang cung cấp LLaMA với một số tham số kích thước bao gồm 7B, 13B, 33B và 65B. Công ty cũng đã phát hành thẻ mô hình LLaMA trên GitHub, cung cấp thêm thông tin chi tiết về chính mô hình đó và các nguồn dữ liệu đào tạo công khai của Meta.

Theo thông tin đưa ra, mô hình này đã được đào tạo bằng CCNet (67%), C4 (15%), GitHub (4,5%), Wikipedia (4,5%), Sách (4,5%), ArXiv (2,5%) và Stack Exchange ( 2%).

Mặc dù đây là một mô hình nền tảng có khả năng thích ứng với một số trường hợp sử dụng khác nhau, nhưng công ty thừa nhận rằng những ẩn số liên quan đến thành kiến và các bình luận độc hại vẫn là một mối đe dọa cần được cải thiện. Hy vọng của công ty là việc chia sẻ mô hình nhỏ nhưng linh hoạt này sẽ dẫn đến những cách tiếp cận mới có thể hạn chế hoặc trong một số trường hợp loại bỏ các con đường khai thác mô hình tiềm năng.

Những người quan tâm có thể tải tài liệu nghiên cứu LLaMA hoàn chỉnh từ blog Meta Research. Những người quan tâm đến việc đăng ký quyền truy cập có thể làm như vậy trên mẫu yêu cầu trực tuyến của Meta.

Theo Viettimes

CÁC TIN KHÁC

Meta tung ra trợ lý AI cải tiến, cạnh tranh vị trí dẫn đầu với OpenAI

Meta Platforms vừa phát hành các phiên bản của mô hình ngôn ngữ lớn (LLM) mới nhất mang tên Llama 3, cùng với một trình tạo hình ảnh có khả năng cập nhật hình ảnh theo thời gian thực dựa trên các yêu cầu bằng văn bản của người dùng. Đây được xem là một bước đi của Meta nhằm bắt kịp OpenAI, công ty dẫn đầu thị trường Trí tuệ nhân tạo (AI) tạo sinh.

Air New Zealand công bố chặng bay đầu tiên sử dụng máy bay điện

Việc sử dụng máy bay điện Beta ALIA là một bước đi quan trọng trong nỗ lực của hãng hàng không Air New Zealand nhằm giảm khí thải nhà kính.

Nhà máy điện hạt nhân lớn nhất thế giới sắp hồi sinh

Nhật Bản sắp khởi động lại hoạt động sản xuất ở nhà máy điện hạt nhân Kashiwazaki - Kariwa sau thời gian dài đóng cửa do ảnh hưởng của thảm họa Fukushima.

[IDEASNEWS] Mô hình AI có khả năng phát hiện nguy cơ rối loạn căng thẳng sau sang chấn sau khi sinh

Các nhà nghiên cứu đã phát triển một công cụ trí tuệ nhân tạo (AI) đột phá có khả năng phát hiện dấu hiệu của rối loạn căng thẳng sau sang chấn liên quan đến việc sinh con (CB-PTSD) qua các câu chuyện ngắn của những người mới làm cha mẹ. Công trình nghiên cứu này chứng minh khả năng của chương trình AI trong việc chẩn đoán chính xác CB-PTSD - Vốn là một quy trình đang rất tốn kém và mất thời gian ở thời điểm hiện tại.

Đằng sau việc OpenAI chọn Tokyo để mở văn phòng đầu tiên ở châu Á

Việc mở văn phòng mới ở Tokyo rất quan trọng đối với OpenAI. Nó nhấn mạnh cơ hội mà công ty nhìn thấy trong việc kinh doanh ở 'xứ sở mặt trời mọc'...

Các công cụ AI trong Google Photos sẽ được dùng miễn phí, cho người dùng thấy trí tuệ nhân tạo ‘ảo’ đến mức nào...

Đối với những người đang thắc mắc, Magic Eraser, Photo Unblur và Portrait Light nổi tiếng của Google Photos là một số công cụ hỗ trợ bởi AI nổi tiếng nhất hiện có và trước đây, chúng yêu cầu bạn phải có đăng ký Google One.

Bài viết nổi bật

Đại học Sư phạm TP.HCM ‘bắt tay’ doanh nghiệp công nghệ Việt thúc đẩy chuyển đổi số

Theo hợp tác mới ký kết với Viettel Solutions, Đại học Sư phạm TP.HCM sẽ cùng doanh nghiệp này xây dựng các giải pháp công nghệ trong giáo dục tập trung vào 4 nội dung chính.

Nhóm sinh viên trường ĐH Ngoại thương giành giải ‘Olympic Kinh tế lượng và ứng dụng’

Ngày 12/6, tại Học viện Tài chính diễn ra Chung khảo Hội thi khoa học sinh viên toàn quốc 'Olympic Kinh tế lượng và ứng dụng' lần thứ VII, năm 2022. Ban Giám khảo đã chọn ra nhóm sinh viên ĐH Ngoại thương TP. Hồ Chí Minh giành giải Đặc biệt.

Bài viết mới nhất

Meta tung ra trợ lý AI cải tiến, cạnh tranh vị trí dẫn đầu với OpenAI

Meta Platforms vừa phát hành các phiên bản của mô hình ngôn ngữ lớn (LLM) mới nhất mang tên Llama 3, cùng với một trình tạo hình ảnh có khả năng cập nhật hình ảnh theo thời gian thực dựa trên các yêu cầu bằng văn bản của người dùng. Đây được xem là một bước đi của Meta nhằm bắt kịp OpenAI, công ty dẫn đầu thị trường Trí tuệ nhân tạo (AI) tạo sinh.

[WOWTIMES – VIETKINGS] (1922-2024) Khách sạn Dalat Palace – Châu Âu cổ kính giữa lòng phố núi – Top 100 đơn vị trên 100 tuổi còn hoạt động tại Việt Nam 2024 – P.6

(nienlich.vn) Khách sạn Dalat Palace là một trong những công trình điển hình cho di sản kiến trúc Pháp ở xứ sở sương mù Đà Lạt. Không những thế, công trình này còn là chứng tích đánh dấu sự hình thành và phát triển của cao nguyên Lâm Viên, là địa chỉ đỏ gắn với sự ra đời của Chi bộ Đảng Cộng sản đầu tiên của tỉnh này.

Quần thể di tích hồ Gươm – đền Ngọc Sơn (Hà Nội) – TOP 10 khu di tích có giá trị lịch sử của Việt Nam được nhiều người biết đến (P.2) – [VIETKINGS-TOPPLUS – Hành trình TOP Việt Nam]

(kyluc.vn) Với người dân Hà Nội, Hồ Gươm, đền Ngọc Sơn là niềm tự hào. Còn với người dân ở các tỉnh, thành phố khác thì từ lâu hình ảnh Hồ Gươm và đền Ngọc Sơn đã gần như trở thành 1 biểu tượng của Hà Nội. Không những thế đây còn là một điểm đến chứa đựng nhiều giá trị văn hóa, lịch sử của thủ đô, là nơi mà bất kỳ du khách nào cũng phải ghé thăm khi đến với Hà Nội. Di tích lịch sử và danh lam thắng cảnh hồ Hoàn Kiếm và đền Ngọc Sơn bao gồm hồ Hoàn Kiếm, đền Ngọc Sơn và khu tưởng niệm vua Lê.

Khởi động Giải thưởng Sáng tạo Nội dung Số Việt Nam 2024 với nhiều điểm mới

Giải thưởng Sáng tạo Nội dung Số Việt Nam 2024 (VCA 2024) bên cạnh 7 hạng mục giải thưởng đã được công bố từ VCA 2023, năm 2024 Ban tổ chức đã bổ sung thêm hạng mục thứ 8.

TOP 100 Hồng bảo Kỷ lục Thế giới tại Việt Nam (P.47) Tháp Pô Sah Inư (Bình Thuận): Vẻ đẹp tháp cổ trên đồi Bà Nài – [VIETKINGS-TOPPLUS đề cử]

(kyluc.vn) Trải qua bao biến đổi của thời gian và thăng trầm lịch sử, tháp Po Sah Inư vẫn đứng sừng sững, trầm mặc với vẻ đẹp nguyên sơ, bí ẩn. Đến đây, ngoài chiêm ngưỡng vẻ đẹp huyền bí, kiến trúc nghệ thuật độc đáo của tháp, du khách còn được nghe kể về thiên tình sử đẫm lệ của nàng công chúa vương quốc Chăm Pa xưa.

Khả năng cuộc cách mạng thiết bị AI ‘khai tử’ điện thoại thông minh

Tham vọng của Humane là khai tử điện thoại thông minh hoặc ít nhất là giảm nhu cầu thiết bị đang được coi là thứ không thể thiếu trong cuộc sống hiện đại này.