לדלג לתוכן

Qwen

מתוך ויקיפדיה, האנציקלופדיה החופשית
Qwen
通义千问
הלוגו של Qwen 2.5, מודל השפה הפופולרי ביותר ברשימת המודלים של Qwen
הלוגו של Qwen 2.5, מודל השפה הפופולרי ביותר ברשימת המודלים של Qwen
מפתח Alibaba Cloud
מחזור חיים אפריל 2023 – הווה (כ־3 שנים)
גרסה אחרונה 2.5-Max (28 בינואר 2025)
מערכת הפעלה יישום רשת (Web), אנדרואיד, iOS
נכתבה בשפות פייתון
סוג רישיון אפאצ'י 2.0
קוד מקור פתוח חלקית
chat.qwen.ai

Qwenסינית מפושטת: 通义千问; טונגי קיאנוון) הוא מודל שפה גדול (LLM) אשר פותח על ידי חברת Alibaba Cloud, חברה בת של קבוצת עליבאבא העוסקת במחשוב ענן. נכון ליולי 2024, Qwen דורג בתור מודל השפה השלישי עם הביצועים הטובים ביותר, אחרי קלוד ו-ChatGPT.[1]

עליבאבא הוציאה את המודל הראשון של Qwen באפריל 2023 תחת השם "טונגי קיאנוון".[2] המודל יצא לאור באופן רשמי בספטמבר 2023 לאחר אישורה של הממשלה הסינית.[3] בדצמבר 2023, עליבאבא הוציאו את המודלים 72B ו-1.8B תחת קוד פתוח.[4]

ביוני 2024 הוציאה עליבאבא את המודל Qwen 2 ובספטמבר היא פרסמה את חלק מהמודלים שלה בקוד פתוח, אך המודלים האיכותיים של החברה לא הופצו בקוד פתוח.[5][6]

בנובמבר 2024, עליבאבא הוציאה את המודל QwQ-32B-Preview, שניסה לחקות את פונקציית ההנמקה (reasoning) של OpenAI o1. המודל יצא תחת רישיון אפאצ'י 2.0 בגרסה חלקית.[7] במספר תחומים, המודל QwQ-32B-Preview הראה ביצועים טובים יותר מהמתחרה, OpenAI o1.[8]

ה-Qwen-VI הוא המודל הוויזואלי של Qwen, והוא משלב Vision transformer, טרנספורמר המיועד למשימות עיבוד ראייה כגון זיהוי תמונה. המודל Qwen-VL2 מחזיק ב-2 עד 7 מיליארד פרמטרים.[9]

בינואר 2025, עליבאבא הוציאה את המודל Qwen 2.5-Max, שעל פי פוסט של החברה, בעל ביצועים טובים יותר מאשר מתחרים כגון GPT-4o, DeepSeek-V3 ו-Llama-3.1-405B, באמות מידה (benchmarks) עיקריות.[10][11]

קישורים חיצוניים

[עריכת קוד מקור | עריכה]
ויקישיתוף מדיה וקבצים בנושא Qwen בוויקישיתוף

הערות שוליים

[עריכת קוד מקור | עריכה]
  1. Alibaba’s open-source AI model tops Chinese rivals, ranks 3rd globally, South China Morning Post, 2024-07-11 (באנגלית)
  2. Bai, Jinze; Bai, Shuai; Chu, Yunfei; Cui, Zeyu; Dang, Kai; Deng, Xiaodong; Fan, Yang; Ge, Wenbin; Han, Yu (2023-09-28), Qwen Technical Report, doi:10.48550/arXiv.2309.16609
  3. Alibaba opens Tongyi Qianwen model to public as new CEO embraces AI, South China Morning Post, 2023-09-13 (באנגלית)
  4. 陈柳兵, Alibaba unveils new Tongyi Qianwen AI language model, global.chinadaily.com.cn
  5. Alibaba says new AI model Qwen2 bests Meta’s Llama 3 in tasks like maths and coding, South China Morning Post, 2024-06-07 (באנגלית)
  6. Arjun Kharpal, China's Alibaba launches over 100 new open-source AI models, releases text-to-video generation tool, CNBC, 2024-09-19 (באנגלית)
  7. Ben Dickson, Alibaba releases Qwen with Questions, an open reasoning model that beats o1-preview, VentureBeat, 2024-11-29 (באנגלית אמריקאית)
  8. Kyle Wiggers, Alibaba releases an 'open' challenger to OpenAI's o1 reasoning model, TechCrunch, 2024-11-27 (באנגלית אמריקאית)
  9. Wang, Peng; Bai, Shuai; Tan, Sinan; Wang, Shijie; Fan, Zhihao; Bai, Jinze; Chen, Keqin; Liu, Xuejing; Wang, Jialin (2024-10-03), Qwen2-VL: Enhancing Vision-Language Model's Perception of the World at Any Resolution, doi:10.48550/arXiv.2409.12191
  10. Qwen Team, Qwen2.5-Max: Exploring the Intelligence of Large-scale MoE Model, Qwen, 2025-01-28 (באנגלית)
  11. אדוארדו בפטיסטה, Alibaba releases AI model it says surpasses DeepSeek, רויטרס