POINTS 1.5是什么?
POINTS1.5是微信最新發布的多模態大模型,性能超越了同級別開源模型,位居OpenCompass Leaderboard榜首。 它采用LLaVA架構,使用NaViT風格視覺編碼器和Qwen2.5-7B-Instruct大語言模型,支持中英文雙語理解和生成。POINTS1.5在多個基準測試和真實場景中表現出色,具備強大的視覺理解、推理和信息提取能力。 該模型通過單獨訓練視覺編碼器、預熱投影層以及使用高質量指令微調數據集進行訓練,并使用模型湯技術提升性能。
POINTS 1.5的主要特性
- 多模態理解:POINTS1.5 能夠理解和處理文本和圖像信息,具備強大的視覺理解能力,包括 OCR、物體識別、圖像描述等。
- 推理能力: POINTS1.5 在多項推理任務上表現出色,例如數學推理、邏輯推理等,能夠從文本和圖像中提取關鍵信息并進行推理。
- 雙語支持: POINTS1.5 支持中文和英文,能夠理解和生成兩種語言的文本,并進行跨語言的圖像理解。
POINTS 1.5的性能評測

POINTS1.5 在 OpenCompass Leaderboard 上排名全球 10B 以下開源模型榜首,超越了 Qwen2-VL、InternVL2 和 MiniCPM-V-2.5 等業界領先模型。
在多個 benchmark 上表現出色,包括 ChartQA、MME、LLaVA-Wild、SEEDBench、MEGABench、ScienceQA、MATH-Vision 和 MathVerse。
在真實場景測試中也表現出色,包括 OCR、推理能力、關鍵信息提取、Latex 公式提取、數學、圖片翻譯和物體識別。
如何使用POINTS 1.5?
要想使用POINTS1.5,您可以通過以下途徑:
- HuggingFace: 您可以在HuggingFace平臺上找到POINTS1.5的模型以及相關資源,鏈接為:https://huggingface.co/WePOINTS/POINTS-1-5-Qwen-2-5-7B-Chat 。
- Github: 您也可以訪問POINTS的Github倉庫獲取模型代碼和更多信息,鏈接為:https://github.com/WePOINTS/WePOINTS 。
通過以上兩種方式,您可以下載模型,并在您的應用程序或研究項目中使用POINTS1.5進行多模態理解、推理、信息提取等任務。