Một kẻ thách thức mới đang đối đầu với ChatGPT của OpenAI, đó là công ty sản xuất trình tạo hình ảnh AI phổ biến Stable Diffusion. StableLM là sản phẩm của Stability AI, là một chatbot nguồn mở được phát triển để dân chủ hóa quyền truy cập vào các mô hình ngôn ngữ tiên tiến.
Stability AI đã công bố phiên bản alpha của StableLM, đánh giá đó là một giải pháp nhỏ hơn và hiệu quả hơn so với hầu hết các giải pháp khác. Với chỉ từ ba tỷ đến bảy tỷ tham số, StableLM là một mô hình nhỏ hơn gấp 2% đến 4% so với kích thước của mô hình 175 tỷ tham số của ChatGPT.
Tương tự như Stable Diffusion, một trình tạo hình ảnh dễ tiếp cận hơn có thể được mở rộng bởi các nhà phát triển bên thứ ba, StableLM cũng cung cấp giải pháp mã nguồn mở và miễn phí giống như một chatbot AI dành cho tất cả mọi người.
StableLM đã được đào tạo với tập dữ liệu thử nghiệm mới từ EleutherAI được gọi là “The Pile”. Với khả năng thực hiện các cuộc hội thoại và viết mã với hiệu suất cao, StableLM đã tiến bộ đáng kể. Tập dữ liệu “The Pile” chứa đến 1,5 nghìn tỷ mã thông báo, lớn hơn ba lần so với tập dữ liệu được sử dụng để đào tạo hầu hết các mô hình AI. ChatGPT đã được đào tạo trên “The Pile” nhưng sau đó đã trải qua nhiều cải tiến hơn, bao gồm cả việc học tăng cường để giúp giảm các kết quả sai sót. Hầu hết mọi người đều cảm thấy ChatGPT là người dẫn đầu trong lĩnh vực trò chuyện AI.
Một trong những yếu tố quan trọng trong việc đảm bảo tính ổn định của AI là khả năng hoạt động trên các hệ thống chi phí thấp hơn và GPU kém mạnh mẽ hơn. StableLM là một mô hình AI hiệu quả cao, được đưa ra để đáp ứng yêu cầu này. Hiện tại, phiên bản alpha của StableLM đã có thể cài đặt và chạy được. Hướng dẫn chi tiết về cách sử dụng phiên bản này trên các máy tính có khả năng GPU hạn chế có thể được tìm thấy trên kho lưu trữ GitHub, kèm theo các sổ ghi chép chi tiết.
Để dễ dàng trải nghiệm thử StableLM, người dùng có thể truy cập vào trang demo Hugging Face. Tuy nhiên, do đây là phiên bản alpha mới được phát hành, thời gian phản hồi có thể sẽ chậm hơn và kết quả có thể không tốt bằng so với bản phát hành chính thức.
Cần lưu ý rằng StableLM là một mô hình ngôn ngữ lớn được đào tạo trước mà không cần phải tinh chỉnh thêm. Điều này có nghĩa là AI sẽ không thể chịu trách nhiệm hoàn toàn về kết quả mà nó đưa ra. Không giống như ChatGPT, StableLM không sử dụng phương pháp học tăng cường, do đó, câu trả lời của nó có thể có chất lượng khác nhau và có khả năng bao gồm ngôn ngữ và quan điểm xúc phạm. Do đó, người sử dụng nên cân nhắc và sử dụng AI một cách có trách nhiệm và cẩn thận.
Có thể liệu các mô hình StableLM mới sắp ra mắt có thể cạnh tranh được với ChatGPT hay không là một câu hỏi đang được quan tâm trong cộng đồng nghiên cứu và phát triển AI. Hiện nay, việc tiến hành nghiên cứu và phát triển các mô hình này đang được thực hiện một cách tích cực. Một trong những đối thủ đáng chú ý là mô hình mã nguồn mở CollosalGPT.
Tuy nhiên, như đã được thông tin từ AI ổn định, đó không phải là kết thúc của câu chuyện. Các mô hình lớn hơn với 15 tỷ, 30 tỷ và 65 tỷ tham số đang được phát triển và kỳ vọng sẽ giúp cải thiện chất lượng kết quả. Hơn nữa, một mô hình lớn hơn với 175 tỷ tham số cũng được lên kế hoạch cho tương lai. Mặc dù hiện tại kích thước mô hình còn hạn chế, tuy nhiên StableLM đã có một khởi đầu tốt.
Với tính chất nguồn mở và việc triển khai nhẹ của phiên bản alpha của StableLM, các nhà phát triển có thể dễ dàng bắt đầu thực hiện các ứng dụng sử dụng mô hình này. StableLM có đủ tiềm năng để phát triển và cải thiện, và đáng để theo dõi như một chatbot AI mới.