
GPT-4o Voice تصل هذا الأسبوع
أعلن Sam Altman عبر حسابه في X | تويتر أن ميزة الصوت الجديدة لنموذج GPT-4o ستكون متاحة لبعض مستخدمي Plus بشكل محدود هذا الأسبوع.
المعلومات المعروفة عن النموذج حتى الآن:
⇠ سيتم إطلاق النسخة Alpha لمجموعة مختارة من مستخدمي ChatGPT Plus خلال هذا الشهر.
- من المتوقع تكون متاحة لجميع مستخدمي Plus في الخريف القادم.
⇠ كانت الآلية السابقة تتضمن ثلاث مراحل: تحويل الصوت إلى نص، ثم المعالجة بـ AI، ثم تحويل النص إلى صوت.
- الآن، يقوم GPT-4o بمعالجة الصوت والنص معًا باستخدام ذكاء اصطناعي واحد.
⇠ يتم الرد بمتوسط سرعة 320ms (0.32 ثانية)، مما يجعل التفاعل قريبًا من المحادثات البشرية الطبيعية.
- الميزة تفهم لهجة المتحدث ومشاعره بدقة أكبر.
⇠ يمكنها التعرف على أصوات متعددة وضوضاء الخلفية.
- تتيح الميزة إخراج أصوات متنوعة تشمل الضحك والغناء والتعبيرات العاطفية وأصوات الخلفية، مما يعزز الطابع الطبيعي للمحادثة.
⇠ المدخلات تشمل النص والصوت والصور والفيديو.
- المخرجات تشمل النص والصوت والصور.
#AI
#Chatgpt
#OpenAi