Avatar
FWEnoir
0d119c15a5495d0c14a415f55823acb5547b3b0064190a9a3db92ed66d7b1b39
隨手筆記 / AI / LLM / Golang / Flutter / Software Engineering / 台灣 / Taiwan

## Introducing GPT-4 Summarization with Chain of Density Prompting

- Researchers from institutions like Columbia University have developed a "Chain of Density" (CoD) prompting method for generating GPT-4 summaries with varying information density.

- The CoD method iteratively incorporates missing salient entities from the original text into the previous summary, making it increasingly entity-dense without changing the summary length.

- Human preference studies show that people prefer denser summaries than those generated by standard GPT-4 prompts, with these summaries being almost as dense as human-written ones.

- The research team conducted human and automatic evaluations on 100 CNN DailyMail articles to better understand the trade-off between informativeness (favoring more entities) and clarity (favoring fewer entities).

- The study provides 500 annotated CoD summaries and an additional 5,000 unannotated summaries for evaluation or distillation.

#AI #LLM #GPT #GPT-4

🔗 Learn more: [2309.04269.pdf](https://ppl-ai-file-upload.s3.amazonaws.com/web/direct-files/1019777/d1249c62-2da9-4810-9797-cac455065e49/2309.04269.pdf)

LlamaIndex(GPT Index)是一個用於構建LLM應用程序的數據框架。它提供了以下工具:

- 提供數據連接器,以便將您現有的數據源和數據格式(API,PDF,文檔,SQL等)整合到系統中。

- 提供結構化數據的方法,以便將這些數據與LLM輕鬆結合使用。

- 提供高級檢索/查詢接口:輸入任何LLM輸入提示,返回檢索到的上下文和知識增強輸出。

- 方便地與外部應用程序框架(例如LangChain,Flask,Docker,ChatGPT等)集成。

LlamaIndex為初學者和高級用戶提供了工具。高級API允許初學者使用LlamaIndex在5行代碼中整合和查詢數據。低級API允許高級用戶自定義和擴展任何模塊(數據連接器,索引,檢索器,查詢引擎,重新排序模塊),以滿足他們的需求。

#AI #LLM #GPT #LLama

https://github.com/jerryjliu/llama_index

GPT-InvestAR:利用大型語言模型分析年度報告以提升股票投資策略

本篇論文旨在利用大型語言模型(LLM)簡化分析上市公司年度報告的過程。年度報告包含了公司財務狀況的重要信息,對股價具有潛在影響。通過將LLM生成的洞察與歷史股價數據相結合,訓練機器學習模型,實現對S&P500回報的顯著超額收益。本文為未來研究提供了框架,並已開源代碼。

#AI #LLM #Stock

https://arxiv.org/abs/2309.03079v1

有秋天的感覺了,風吹起來很舒爽。太陽曬了也不覺得特別熱。 https://nostrcheck.me/media/public/nostrcheck.me_2752149738649241911694409277.webp

電腦端真的 gossip 用起來最順暢,個人對他唯一抱怨就不能選取字串。

提升 LLM 思考的技巧,從 CoT 到 ToT 現在來了個 GoT

https://arxiv.org/abs/2308.09687

ChatDev 是一個虛擬軟件公司,通過多個具有不同角色的智能代理(如首席執行官、首席技術官、程序員、測試員等)進行運作。這些代理組成了一個多代理組織結構,共同致力於通過編程改變數字世界。ChatDev 的主要目標是提供一個易於使用、高度可定制和可擴展的框架,該框架基於大型語言模型(LLM),並作為研究集體智慧的理想場景。

#AI #AIAgent #LLM

https://github.com/OpenBMB/ChatDev

可以,我跑在本機的 CUDA 環境沒問題

#Note

Use cloudflare tunnel in colab.

```

!wget https://github.com/cloudflare/cloudflared/releases/latest/download/cloudflared-linux-amd64 -O cloudflared

!chmod a+x cloudflared

!./cloudflared service install

```

新發表的換臉AI,不需要像以前訓練 Model

https://github.com/facefusion/facefusion

我們推出了ChatGPT Enterprise,提供企業級的安全和隱私保護、無限制的高速GPT-4訪問、更長的上下文窗口以處理更長的輸入、高級數據分析功能、定制選項等等。自ChatGPT推出以來,已有超過80%的財富500強公司的團隊使用它。ChatGPT Enterprise的早期用戶,如Block、Canva、Carlyle、雅詩蘭黛公司、普華永道和Zapier等行業領袖,正在重塑他們的運營方式,利用ChatGPT進行更清晰的溝通、加速編碼任務、快速探索復雜業務問題的答案、協助創意工作等。

ChatGPT Enterprise提供企業級的隱私、安全和部署工具,您可以擁有並控制您在ChatGPT Enterprise中的業務數據。我們不會在您的業務數據或對話上進行訓練,我們的模型也不會從您的使用中學習。ChatGPT Enterprise還符合SOC 2標準,所有對話在傳輸和存儲過程中都是加密的。新的管理控制台可以讓您輕鬆管理團隊成員,並提供域名驗證、單點登錄和使用情況分析等功能,方便大規模部署到企業。[1]

Citations:

[1] https://openai.com/blog/introducing-chatgpt-enterprise#:~:text=We%E2%80%99re%20launching%20ChatGPT%20Enterp

Facebook 的 SeamlessM4T 翻譯模型

S2ST (Speech to Speech translation)模式品質挺不錯的,感覺如果速度再提高可以成為很成熟的即時翻譯方案。

#AI #META

https://github.com/facebookresearch/seamless_communication

這篇文章討論了人工智能(AGI)的概念,即在人類能夠執行的廣泛任務上達到或超越人類性能的人工智能系統。AGI具有利弊,優點是可以執行大量消耗人類時間和精力的勞動,實現烏托邦。然而,AGI也可能導致經濟失衡,使少數公司壟斷經濟,加劇1%精英與其他人類之間的差距。此外,超智能AGI可能會為了自己的目的奴役或消滅人類。作者對大型語言模型(如GPT系列)通向AGI的觀點表示懷疑。文章試圖解釋為什麼作者持這種觀點,以及在追求AGI時可能缺少哪些要素。要實現AGI,我們可能需要以下一個或多個要素:在未知任務、狀態和行為下運行的在線非貪婪規劃技術;能夠預測所有可能遇到的狀態和行為的世界模型技術;以及將大型語言模型用於AGI的方法。這三個缺失的能力是相互關聯的,規劃、探索和世界模型都是實現AGI的重要組成部分[1]。

Citations:

[1] https://mark-riedl.medium.com/toward-agi-what-is-missing-c2f0d878471a#:~:text=Toward%20AGI%20%E2%80%94%20What%20is%20Missing%3F%0A