Các Thuật ngữ trong API -ChatGPT

API OpenAI có thể được áp dụng cho hầu hết mọi công việc liên quan đến việc hiểu hoặc tạo ngôn ngữ hoặc mã tự nhiên. Open AI cung cấp một loạt các models với các mức sử dụng khác nhau phù hợp với các tác vụ khác nhau, cũng như khả năng tinh chỉnh các models tùy chỉnh của riêng bạn. Các models này có thể được sử dụng cho mọi thứ, từ tạo nội dung đến tìm kiếm và phân loại ngữ nghĩa.

Prompts and completions

Completions endpoint : là trung tâm của API. Nó cung cấp một giao diện đơn giản cho các models ,cực kỳ linh hoạt và mạnh mẽ. Bạn nhập một số văn bản dưới dạng prompt và models sẽ tạo phần hoàn thành văn bản cố gắng khớp với bất kỳ ngữ cảnh hoặc mẫu nào bạn đã cung cấp cho nó. Ví dụ: nếu bạn đưa ra prompt cho API, “Viết khẩu hiệu cho một cửa hàng kem”, nó sẽ trả về kết quả hoàn thành như “Chúng tôi phục vụ những nụ cười với mỗi muỗng!”

Thiết kế prompt của bạn về cơ bản là cách bạn “lập trình” models, thường bằng cách cung cấp một số hướng dẫn hoặc một vài ví dụ. Điều này khác với hầu hết các dịch vụ NLP khác được thiết kế cho một nhiệm vụ duy nhất, chẳng hạn như phân loại tình cảm hoặc nhận dạng thực thể được đặt tên. Thay vào đó, điểm cuối hoàn thành có thể được sử dụng cho hầu hết mọi tác vụ bao gồm tạo nội dung hoặc mã, tóm tắt, mở rộng, hội thoại, viết sáng tạo, chuyển đổi phong cách, v.v.

Tokens

Các models hiểu và xử lý văn bản bằng cách chia nhỏ văn bản đó thành các tokens. Tokens có thể là từ hoặc chỉ là khối ký tự. Ví dụ: từ “hamburger” được chia thành các tokens “ham”, “bur” và “ger”, trong khi một từ ngắn và phổ biến như “lê” là một tokens duy nhất. Nhiều tokens bắt đầu bằng khoảng trắng, ví dụ: “xin chào” và “tạm biệt”.

Số lượng tokens được xử lý trong một yêu cầu API nhất định tùy thuộc vào độ dài của cả đầu vào và đầu ra của bạn. Theo nguyên tắc chung, 1 tokens có khoảng 4 ký tự hoặc 0,75 từ đối với văn bản tiếng Anh. Một hạn chế cần lưu ý là prompt văn bản và completions được tạo kết hợp không được nhiều hơn độ dài ngữ cảnh tối đa của models (đối với hầu hết các models, đây là 2048 tokens hoặc khoảng 1500 từ). Hãy xem công cụ tokens để tìm hiểu thêm về cách chuyển văn bản thành tokens.

Models

API được cung cấp bởi một tập hợp các mô hình với các khả năng và mức giá khác nhau. Các mẫu GPT-3 cơ sở của chúng tôi được gọi là Davinci, Curie, Babbage và Ada. Sê-ri Codex của chúng tôi là hậu duệ của GPT-3 đã được đào tạo về cả ngôn ngữ tự nhiên và mã.


Add Comment