Azure OpenAI ChatGPT 服務模型詳解。

Azure OpenAI 每個模型系列都有一系列模型,這些模型按功能進一步區分。 這些功能通常由名稱標識,並且這些名稱的字母順序通常指示給定模型系列中該模型的相對功能和成本。 例如,GPT-3 模型使用 Ada、Babbage、Curie 和 Davinci 等名稱來指示相對功能和成本。 Davinci 比 Curie 功能更強大《且成本更高》,而 Curie 又比 Babbage 功能更強大《且成本更高》,依此類推。

Azure OpenAI ChatGPT 服務模型詳解。Azure OpenAI- ChatGPT

Azure OpenAI-ChatGPT

Azure OpenAI- ChatGPT

Azure OpenAI- ChatGPT 模型

  • GPT-4 模型《預覽版》
  • 與任何 OpenAI 以前的模型相比,GPT-4 可以更準確地解決難題。 與 gpt-35-turbo 一樣,GPT-4 針對聊天進行了優化,但適用於傳統的完成任務。

    這些模型目前處於預覽狀態。 要獲取訪問權限,現有的 Azure OpenAI 客戶可以通過填寫此表單來提出申請。

    • gpt-4
    • gpt-4-32k

    gpt-4 最多支持 8192 個輸入令牌,而 gpt-4-32k 最多支持 32,768 個令牌。

  • GPT-3 模型
  • GPT-3 模型可以理解和生成自然語言。 該服務提供四個模型功能,每個都有不同級別的能力以及適用於不同任務的速度。 Davinci 是功能最強大的模型,而 Ada 是速度最快的模型。 模型排序《按功能從高到低的順序》:

    • text-davinci-003
    • text-curie-001
    • text-babbage-001
    • text-ada-001

    雖然 Davinci 能力最強,但其他模型提供了顯著的速度優勢。 我們的建議是讓用戶在試驗時從 Davinci 開始,因為它能產生最佳結果並驗證 Azure OpenAI 可以提供的價值。 原型正常工作後,就可以優化模型選擇,為應用程序實現最佳延遲/性能平衡。

    Davinci

    Davinci 是功能最強大的模型,可以執行其他模型能夠執行的任何任務,並且所用的指令通常更少。 對於需要深入理解內容的應用程序《例如面向特定受眾的摘要和創意內容的生成》,Davinci 將產生最佳結果。 Davinci 提供的這些增加的功能需要更多計算資源,因此 Davinci 的成本更高,並且 Davinci 不如其他模型快。

    Davinci 擅長的另一個領域是理解文本的意圖。 Davinci 擅長解決多種邏輯問題並解釋字符動機。 Davinci 已經能夠解決一些涉及因果關系的最具挑戰性的 AI 問題。

    用途:復雜的意圖、因果關系、受眾摘要

    Curie

    Curie 功能強大,但速度很快。 雖然 Davinci 在分析復雜文本方面更強大,但 Curie 可以執行許多精細化的任務,例如情緒分類和摘要。 Curie 也善於回答問題和執行問答,適合用作常規服務聊天機器人。

    用途:語言翻譯、復雜分類、文本情緒、摘要

    Babbage

    Babbage 可以執行簡單的分類等簡單任務。 在語義搜索方面,它的功能也很強大,可對文檔與搜索查詢的匹配程度進行排名。

    用途:中等分類、語義搜索分類

    Ada

    Ada 通常是最快的模型,可以執行的任務有分析文本、地址更正和不需要太多細微差別的某些分類任務等等。 Ada 的性能通常可以通過提供更多上下文來改進。

    用途:分析文本、簡單分類、地址更正、關鍵字

    3.ChatGPT (gpt-35-turbo)《預覽版》

    ChatGPT 模型 (gpt-35-turbo) 是一種專為對話接口設計的語言模型,該模型的行為方式與以前的 GPT-3 模型不同。 以前的模型是文本輸入和文本輸出,這意味著它們接受了提示字符串並返回了一個會追加到提示的補全。 但是,ChatGPT 模型是對話傳入和消息輸出。模型需要攝入具體的類似聊天腳本形式的提示字符串,並返回作為聊天中模型編寫的消息的補全。

    要詳細了解 ChatGPT 模型以及如何與聊天 API 進行交互,請查看深入了解操作方法。

    Codex 模型

    Codex 模型是基模型 GPT-3 的子代,可以理解和生成代碼。 它們的訓練數據包含自然語言和來自 GitHub 的數十億行公開代碼。

    它們最擅長 Python,並且精通十幾種語言,包括 C#、JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL 和 Shell。 Codex 模型排序《按功能從高到低的順序》:

    • code-davinci-002
    • code-cushman-001

    Davinci

    類似於 GPT-3,Davinci 是功能最強大的 Codex 模型,可以執行其他模型能夠執行的任何任務,並且所用的指令通常更少。 對於需要深入了解內容的應用程序,Davinci 會生成最佳結果。 更強的功能需要更多計算資源,因此 Davinci 的成本更高,並且不如其他模型快。

    Cushman

    Cushman 功能強大,但速度很快。 雖然 Davinci 在分析復雜任務方面更強大,但 Cushman 是能夠執行許多代碼生成任務的模型。 Cushman 通常也比 Davinci 運行速度更快、成本更低。

    嵌入模型

    目前,我們提供了三個系列的嵌入模型以實現不同的功能:

    • 相似度
    • 文本搜索
    • 代碼搜索

    每個系列都包含某一功能范圍的模型。 以下列表根據模型功能指示服務返回的數字向量長度:

    • Ada:1024 個維度
    • Babbage:2048 個維度
    • Curie:4096 個維度
    • Davinci:12288 個維度

    Davinci 功能最強,但比其他模型更慢更貴。 Ada 功能最弱,但速度更快且更成本更低。

    深圳市雲展信息技術有限公司成立於2015年,專註於雲計算, BI大數據,數據中心, IoT物聯網,人工智能, IT基礎架構,信息安全等專業領域的高新技術企業,在廣州、武漢等地設有分支機構,與眾多的國內外知名軟件廠商實現了全方位的緊密合作,先後的成為Microsoft、AWS、 Oracle、 VMware、 Citrix、 IBM、 Dell EMC、 Veritas、華為、阿裡、騰訊的服務提供商,擁有豐富的軟件產品線和解決方案。

    目前提供Azure OpenAI,ChatGPT試用,解決方案咨詢,應用開發與推廣,托管運維技術服務。