Seberapa Canggih AI Generatif Milik Alibaba Cloud
- Alibaba Cloud
VIVA Tekno – Alibaba Cloud, anak usaha Alibaba Group, mengumumkan ketersediaan dua Large Language Models (LLM) open-source bernama Qwen-72B dan Qwen-1,8B untuk menangani perintah rumit di aplikasi berbasis kecerdasan buatan (artificial intelligence/AI).
Selain itu, Alibaba Cloud juga menyediakan LLM multimodal bernama Qwen-Audio dan Qwen-Audio-Chat. Dua LLM tersebut memiliki fitur untuk memahami audio dan menyempurnakan percakapan dengan lebih baik untuk kepentingan penelitian maupun komersial.
"Membangun ekosistem open-source sangat penting untuk mendorong pengembangan LLM dan aplikasi AI. Kami bercita-cita menjadi cloud paling terbuka dan membuat kemampuan AI generatif dapat diakses oleh semua orang," kata CTO Alibaba Cloud Jingren Zhou, melalui keterangan resminya, Senin, 25 Desember 2023.
Fitur ini dapat digunakan dalam aplikasi berbasis AI, seperti chatbot yang telah dipersonalisasi. Alibaba Cloud juga menyediakan LLM Qwen-1,8B, yakni LLM kelas ringan yang dapat digunakan pada perangkat edge dengan sumber daya komputasi terbatas, seperti ponsel pintar (smartphone).
Namun, LLM Qwen-1,8B saat ini hanya tersedia untuk penelitian dan belum tersedia untuk komersial. Selain LLM Qwen-72B dan Qwen-1,8B, Alibaba Cloud juga menyediakan LLM open-source lainnya, yaitu Qwen-Audio dan Qwen-Audio-Chat.
Kedua LLM berbasis AI ini memiliki kemampuan pemahaman audio terbaru yang dapat digunakan dalam penelitian dan komersial. Qwen-Audio dapat memahami input teks dan audio dalam berbagai format, termasuk ucapan manusia, suara natural dan musik, serta menghasilkan teks sebagai output.Tidak hanya itu, LLM ini mampu melakukan lebih dari 30 tugas pemrosesan audio, seperti transkripsi multi-bahasa, pengeditan ucapan, analisis keterangan audio, dan lainnya.
Terakhir, ada LLM dalam versi yang telah disempurnakan untuk percakapan, yakni Qwen-Audio-Chat. LLM ini dapat mendukung sejumlah tanya jawab berdasarkan audio dan melakukan berbagai tugas yang berorientasi pada audio, seperti mendeteksi emosi dan nada dalam pidato manusia.