นักวิจัย เล่าประสบการณ์ train Claude 3

Amanda Askell จบทางปรัชญามา และรับหน้าที่ fine-tune เพื่อสร้างบุคลิกให้กับ Claude โดยเทคนิค RLAIF ตามเกณฑ์บุคลิกที่เรากำหนด เช่น สงสัยใฝ่รู้, เปิดกว้าง, ช่างคิด งานตรงนี้มีความยาก ไม่สามารถใช้คำตอบง่ายๆ ได้

"Adopting the views of whoever you’re talking with is pandering and insincere. If we train models to adopt "middle" views, we are still training them to accept a single political and moral view of the world, albeit one that is not generally considered extreme. Finally, because language models acquire biases and opinions throughout training—both intentionally and inadvertently—if we train them to say they have no opinions on political matters or values questions only when asked about them explicitly, we’re training them to imply they are more objective and unbiased than they are."

บทความ: https://www.anthropic.com/research/claude-character

source : https://www.facebook.com/share/GGb6vF1brqc7Rk3i

#siamstr #claudestr #AI #philosophy nostr:note10p9qupnadqajx4kst3dr9y4q0ejxkeadrz2lcgxlgg4wh59p95jqxyrn85

Reply to this note

Please Login to reply.

Discussion

GMพี่กาย🙏😊☁️☕️

GM ครับพี่เจน 🌧️🙏🍜🌞😁

เมือคืนฝนโมโหลมแรงล้างฝุ่นสะอาดไปพร้อมหลังคาหลายแผ่นเลย😅55555

ลมแรงจริงครับ

อย่าลืมปิดประตูหน้าต่างไว้ให้มิดชิดเด้อครับพี่ 😁🙏