GLM 5.2 adalah model favorit saya yang baru...

Bahasa Indonesiaالعربية Deutsch English Español Français हिन्दी 日本語 한국어 Português Русский 中文

Computing/SoftwareSmall Business/StartupsInternet Technology

Transcript

00:00:00model terbuka terbaik di dunia saat ini bukan berasal dari perusahaan bernama open ai melainkan tentu saja dari

00:00:04lab Tiongkok dan model ini adalah glm 5.2 dari zai, model ini sangat mengesankan, menyamai gpt 5.5 pada

00:00:10tolok ukur tertentu dan bahkan ada kategori di mana model ini tampaknya mengalahkan fable, sembari

00:00:15berlisensi mit terbuka, mari kita lihat. jadi glm 5.2 adalah model dengan total 744 miliar parameter

00:00:26dengan 40 miliar parameter aktif dan ukurannya sebenarnya sama dengan pendahulunya glm 5.1

00:00:31itulah mengapa sangat mengesankan mereka membuat lompatan besar pada indeks kecerdasan

00:00:35dari analisis buatan, ini adalah skor gabungan dari berbagai tolok ukur, jadi penalaran, pengodean

00:00:40sains, dan semuanya. glm 5.2 di sini mendapat skor 51 yang berarti 11 poin di atas iterasi sebelumnya

00:00:45dan menjadi model terbuka teratas dengan margin yang cukup sehat. anda bisa melihat quen 3.7 ada di berikutnya, lalu minimax m3

00:00:51diikuti oleh kimmy k 2.6. ini sebenarnya menempatkannya di ranah yang sama dengan gemini 3.5 flash dan gpt 5.4 pada

00:00:57upaya maksimal, yang cukup gila dan pada beberapa tolok ukur yang disertakan dalam indeks ini seperti gpt val

00:01:03sebenarnya mengungguli gpt 5.5. jika kita fokus pada pengodean secara khusus, model ini masih sangat hebat pada indeks pengodean

00:01:09ia mencetak skor yang sama dengan gemini 3.1 pro dan sebenarnya mengalahkan sonic 4.6 serta tidak terlalu jauh tertinggal dari

00:01:14model-model perbatasan teratas. model ini juga jauh lebih unggul dari kimmy k 2.7 code yang merupakan model terbaru kami yang saya tahu banyak

00:01:19orang termasuk saya sendiri adalah penggemar beratnya. saya selalu merasa model kimmy memiliki kesan yang

00:01:23sangat nyaman. di luar indeks pengodean, tolok ukur lain yang sepertinya disukai banyak orang akhir-akhir

00:01:27ini adalah deep swe, jadi jika kita lihat, model ini sebenarnya mengungguli opus 4.7 pada upaya menengah

00:01:33itu sungguh sangat mengesankan, namun perlu dicatat di sini bahwa tidak setiap model telah

00:01:38diuji pada tolok ukur ini dan pengait yang digunakan sebenarnya adalah clawed code, anda hanya perlu melakukan sedikit trik api

00:01:42untuk mengarah ke zai alih-alih anthropic. rangkaian tolok ukur terakhir yang saya suka adalah design arenas

00:01:47dan di sinilah segalanya menjadi menarik. glm 5.2 baru saja meraih tempat pertama secara keseluruhan di papan peringkat desain web html satu putaran

00:01:53design arena, menjadi model pertama yang pernah mengalahkan lini clawed

00:01:58termasuk fable 5. tampaknya ini mungkin menjadi area fokus dari model tersebut karena penyelidikan lebih lanjut

00:02:02oleh design arena tampaknya menunjukkan bahwa glm 5.2 memiliki seperangkat templat ahli yang menghindari anti-pola

00:02:08ai yang umum, jadi anda seharusnya mendapatkan lebih sedikit gradien ungu dan model ini juga tampaknya bekerja sangat baik

00:02:12dengan pustaka umum seperti chart.js 3.js dan tailwind. model ini memang memiliki sedikit kekurangan yaitu

00:02:18sedikit lebih lambat, tapi saya akan kembali ke sana nanti. model ini juga bukan nomor satu di mana-mana di design arena

00:02:22ia berada di posisi kedua pada pengembangan game, data viz, dan 3d, serta keempat untuk komponen ui, namun itu

00:02:28tetap sangat mengesankan. saya pikir saya akan mencobanya pada beberapa aplikasi demo, dan yang pertama sebenarnya adalah

00:02:32membuat ulang linear, tapi salah satu hal yang menjengkelkan tentang glm 5.2 yang merupakan sedikit kerugian

00:02:37adalah model ini hanya menerima modalitas teks, jadi anda tidak bisa mengunggah tangkapan layar dan mengatakan buat ulang ini

00:02:42jadi apa yang saya lakukan adalah mengirim tangkapan layar ke claude dan mengatakan beri saya perintah untuk membuat ulang ini

00:02:46dan itulah perintah yang akhirnya saya berikan kepada glm 5.2. terlepas dari itu, hasil yang saya dapatkan sangat

00:02:51mengesankan. di sebelah kiri di sini saya memiliki halaman web linear yang asli dan di sebelah kanan di sini kita memiliki hasil buatan glm

00:02:55reka ulang. anda bisa melihat model ini mendapatkan elemen keseluruhan dengan benar dan untuk tangkapan layar di sini sebenarnya hanya

00:02:59membuat ulang ui yang menurut saya sangat keren. saat kita gulir ke bawah anda bisa melihat bahwa model ini mendapatkan suasana

00:03:04keseluruhan dari situs web linear dan saya benar-benar berpikir ini terlihat sangat bagus, jadi model ini memang memiliki keterampilan desain ui

00:03:09yang kuat. jelas tidak sempurna karena tidak bisa mengambil tangkapan layar, jadi model ini semacam melakukan ini sebagai

00:03:14reka ulang dari perintah teks yang saya tunjukkan tadi, tapi halaman web ini terlihat sangat bagus sebagai perbandingan

00:03:19di sebelah kiri saya memiliki apa yang diberikan claude opus 4.8 kepada saya dengan perintah yang persis sama dan yang ini adalah

00:03:23kimmy k 2.7 code dan sekali lagi mereka semua melakukan pekerjaan yang cukup baik dalam membuat ulang situs web hanya dari perintah

00:03:29tersebut dan saya sebenarnya berpikir saya mungkin paling menyukai kimmy k 2.7. model ini hanya memiliki semacam suasana

00:03:34terbaik secara keseluruhan dan terlihat paling lengkap menurut pendapat saya. berikutnya saya pikir ada baiknya untuk

00:03:38memberikan situs web baru yang mungkin belum pernah dilihat oleh model-model ini sebelumnya karena linear mungkin ada dalam

00:03:42data pelatihan banyak dari model-model ini, jadi saya hanya mengatakan desain dan bangun situs web satu halaman yang indah

00:03:46untuk produk fiktif bernama north star, ini adalah aplikasi perencanaan pribadi bertenaga ai. anda bisa melihat

00:03:50ada juga beberapa arahan desain di bawah sini seperti kami menginginkan bagian hero, beberapa bukti sosial, bagian harga

00:03:56semua hal biasa dan di bawah sini arahan desainnya adalah estetika sas premium yang bersih, gradien lembut, tipografi kuat, kartu bulat, dan sebagainya.

00:04:00ini adalah hasil yang saya dapatkan dari dua model dan saya akan memberi tahu anda mana yang mana di akhir, tetapi anda bisa melihat saat kita

00:04:06gulir ke bawah, saya pikir ini terlihat sangat bagus dan menurut saya model ini telah melakukan pekerjaan yang cukup baik. ini adalah situs web startup yang cukup dasar dengan

00:04:10bagian harga normal anda dan seterusnya dan sama di sebelah kanan di sini. saya mungkin sedikit lebih menyukai gaya ini

00:04:15tetapi anda bisa melihat model ini telah memilih semacam tampilan ai gradien ungu itu, tapi saya pikir ada sesuatu

00:04:20tentang situs web ini yang terlihat sedikit lebih bersih dan lebih lengkap bagi saya, tetapi itu

00:04:25sepenuhnya subjektif. jika anda memiliki yang favorit, beri tahu saya di komentar di bawah dan juga berlangganan

00:04:29selagi anda di sana. yang di sebelah kiri di sini sebenarnya adalah glm 5.2 dan yang ini adalah clawed opus 4.8

00:04:33untuk kelengkapan, ini adalah apa yang diberikan kimmy k 2.7 code kepada saya dan saya benar-benar berpikir yang satu ini jatuh ke dalam semacam

00:04:39tampilan dan nuansa ai dengan gradien ungu ini, sedikit mirip dengan yang clawed hanya dengan lebih sedikit

00:04:43animasi dan lebih sedikit polesan. saya juga ingin melihat dengan cepat di sini apa yang akan dilakukan glm 5.2 jika saya tidak memberinya

00:04:48arahan desain, jadi saya hanya memberinya bagian awal dari perintah tersebut dan saya tidak berpikir

00:04:53hasilnya terlihat buruk, tetapi saya tidak yakin saya setuju dengan design arena bahwa ini tidak memiliki

00:04:56tampilan ai yang biasa. ini benar-benar menggunakan gradien ungu itu secara maksimal. untuk pengujian berikutnya saya kemudian

00:05:01berpikir untuk menguji mereka pada aplikasi 3gs satu kali jalan dan saya hanya mengatakan bangun game 3gs

00:05:05di mana saya bisa membalap mobil f1 di sekitar silverstone. anda bisa melihat yang satu ini mulai bekerja di sini dan ini memakan waktu

00:05:10total sekitar 10 menit. jika kita gulir sampai ke bawah, menggunakan 40.000 token dan menelan biaya 32

00:05:15sen. ini adalah output yang diberikan glm 5.2 kepada kita, anda bisa melihat tulisan silverstone f1 dan nyalakan

00:05:20mesin anda. ngomong-ngomong, lewis hamilton baru saja menang untuk ferrari, itu benar-benar mengagumkan. saya senang melihat kita punya

00:05:25mobil merah di sini sebagai ferrari juga meskipun kita pasti sedikit lebih lambat dari yang saya inginkan

00:05:30dan satu hal yang saya perhatikan di sini adalah jika saya menekan a, saya tampaknya pergi ke kanan dan d ke kiri, jadi kontrolnya

00:05:35terbalik, tapi tampaknya tidak pada tombol panah dan ini jelas bukan kecepatan yang saya inginkan

00:05:40untuk sebuah ferrari mengelilingi silverstone, tapi maksud saya ini tidak terlalu buruk untuk percobaan pertama. sebenarnya

00:05:45tampaknya saya melaju lebih cepat jika saya mundur, jadi mungkin jika saya hanya mundur di sekitar lintasan itu akan lebih baik. saya mencoba

00:05:51tes yang sama dengan kimmy k 2.7 code tapi saya sebenarnya tidak mendapatkan contoh yang berfungsi dalam satu

00:05:55perintah. di suatu tempat di bawah sini saya memiliki beberapa kesalahan konsol yang terus berulang, jadi saya harus

00:05:59memberitahunya bahwa saya memiliki beberapa kesalahan, tetapi kemudian model itu memperbaikinya pada perintah kedua dan anda bisa melihat

00:06:04yang satu ini sebenarnya menggunakan lebih banyak token yaitu 110.000 dan menelan biaya 81 sen. hasil yang saya dapatkan juga

00:06:08sedikit kurang bisa dimainkan. tampaknya kita memiliki kecepatan yang sedikit lebih tinggi tetapi lingkaran belok kita sangat buruk. saya

00:06:14tidak berpikir saya pernah melihat pembalap f1 berbelok seperti ini dan kita juga bisa menembus beberapa bangunan

00:06:19di sini. keren mereka mendapatkan nama tikungan di silverstone tapi tidak ada lintasan, hanya

00:06:23tampaknya hanya tonggak pembatas. yang terakhir adalah clawed opus 4.8 dan yang ini sedikit lebih bisa dimainkan

00:06:27di samping fakta bahwa saya tidak berpikir ada pohon di tengah lintasan silverstone. maksud saya

00:06:33terakhir kali saya periksa tidak ada. dan ya, secara keseluruhan ini adalah game yang cukup bagus, kita memiliki beberapa kontrol kamera

00:06:37di sini. roda saya mungkin tidak akan menyukainya jika saya seorang pembalap f1, tetapi tampaknya menangani

00:06:42semuanya dengan baik dan lintasannya sendiri sebenarnya juga salah satu lintasan paling membingungkan yang menurut saya pernah saya

00:06:47lihat orang berlomba di sana. ada banyak tumpang tindih di sini dan saya tidak benar-benar tahu harus ke mana

00:06:52tetapi saya akan mengatakan bahwa opus 4.8 memberi kita demo yang paling bisa dimainkan dalam satu perintah. pengujian terakhir yang saya lakukan

00:06:57sedikit lebih terlibat, yaitu front end dan back end dari awal dari manajemen keuangan pribadi

00:07:02dasbor dengan beberapa fitur yang bisa anda lihat terdaftar di sini dan ide umumnya di sini adalah

00:07:07melihat tumpukan apa yang dipilihnya ketika memulai dari baru dan juga apakah ia bisa menghubungkan front end dan back end

00:07:11semuanya dalam perintah tunggal itu tanpa kesalahan. ini upaya glm 5.2 dan saya harus mengatakan ya, ini

00:07:16dasbor yang terlihat cukup dasar. tidak ada yang mewah, tapi juga tidak banyak hal mewah yang bisa anda

00:07:22lakukan dengan perintah yang saya berikan. semuanya tampak berfungsi, saya telah menambahkan hal-hal ke basis data

00:07:26saya membayar langganan fable 5 saya di sini. semua halaman ini bisa diklik dan semuanya benar-benar mentransfer

00:07:32di antara mereka saat saya mengklik ini. saya telah mengujinya, jadi model ini tampaknya telah melakukan pekerjaan yang sangat baik dari

00:07:37perintah tunggal itu. saya selalu penasaran tumpukan apa yang dipilihnya juga dan yang satu ini menggunakan next js

00:07:41aplikasi dan menggunakan prisma untuk basis data dan kita bisa melihat itu di sini kita juga memiliki basis data

00:07:46pengembangan. saya mungkin lebih suka jika menggunakan drizzle dan mungkin tan stack tapi saya tidak bisa benar-benar

00:07:50mengeluh, saya tidak memberinya arahan. ini sebenarnya apa yang diberikan kimmy k 2.7 code kepada saya dan anda bisa melihat ini

00:07:55hampir persis aplikasi yang sama, hanya saja saya akan mengatakan tidak semewah itu. mereka jelas memiliki beberapa

00:07:59templat yang sama dalam pelatihan mereka di suatu tempat yang terlihat persis seperti ini dan lagi, ya saya tidak bisa

00:08:04mengeluh terlalu banyak tentang ini, tetapi ini kehilangan semua tambahan dengan tombol untuk bisa

00:08:09mentransfer. saya mendapatkan fitur tambah akun dan tambah transaksi, semuanya berfungsi, tetapi saya hanya mengatakan

00:08:13ui keseluruhan dari ini dan pengalaman penggunanya sedikit lebih buruk karena tidak memiliki informasi itu

00:08:18yang bisa diklik di atas sini. tumpukan default yang dipilihnya, saya juga akan berpendapat sedikit lebih buruk. model ini menggunakan react di sini dengan

00:08:23hanya pengaturan vt biasa dan react router yang tidak saya masalahkan, tetapi back end-nya memilih

00:08:28express dan jika kita melihat file basis data yang sebenarnya, itu hanya menggunakan node sqlite untuk menulis ke dalamnya dan

00:08:33menulis skema di teks di sini, yang menurut saya akan sedikit kurang bisa ditingkatkan. jika saya

00:08:39benar-benar melakukan vibe coding dan tidak tahu apa-apa tentang tumpukan itu, saya mungkin akan menginginkan glm 5.2, tapi jika saya

00:08:43menggunakan kimike 2.7 code saya mungkin akan memberinya arahan untuk menggunakan drizzle next yes dan

00:08:48berbagai hal lainnya juga, jadi itu hanya bervariasi berdasarkan apa yang anda sukai. berbicara tentang subjektif juga, ini

00:08:53sebenarnya apa yang diberikan claude opus 4.8 kepada saya. model ini jelas menggunakan gaya yang sama sekali berbeda

00:08:58dengan yang telah kita lihat sebelumnya, tetapi ini semacam gaya teks yang disukai claude pada

00:09:03saat ini. ini jelas apa yang mereka masukkan ke dalam data pelatihan atau sedang mendorongnya ke arah tersebut dan semua

00:09:07ini bekerja dengan sangat baik dan ya, saya pikir ini terlihat sangat bagus. saya mungkin akan meminta ini untuk mungkin menggunakan

00:09:11font yang berbeda dan skema warna yang berbeda, tetapi semacam dasar keseluruhannya sangat bagus. tidak

00:09:16benar-benar melakukan halaman terpisah untuk ini, itu hanya melakukan bagian terpisah, jadi mungkin itu lebih buruk, tapi sekali lagi

00:09:20itu tergantung pada perintahnya. semua fitur dan segala sesuatu seperti itu berfungsi. melihat

00:09:25pada kode sebenarnya yang diberikan opus kepada saya, saya sebenarnya berpikir glm 5.2 mungkin telah memenangkan yang satu ini. apa yang opus

00:09:29lakukan adalah hanya menggunakan aplikasi react biasa, itu bahkan tidak repot-repot dengan react router karena

00:09:34semuanya ada pada satu halaman itu dan itu juga menggunakan express untuk back end-nya tetapi kemudian tidak

00:09:38benar-benar melakukan koneksi apa pun ke basis data. semuanya sebenarnya hanya penyimpanan dalam memori yang bisa kita lihat

00:09:43di sini di mana model ini memasukkan data dan hanya menjalankan semuanya dari objek javascript yang lagi-lagi mungkin

00:09:48bukan yang saya inginkan jika saya akan meningkatkan ini di masa depan, tetapi kembali pada perintahnya. saya pikir

00:09:53itu semacam kunci yang saya ambil saat menguji model ini selama beberapa hari terakhir. saya pikir untuk banyak

00:09:58tugas anda bisa diam-diam menukar glm 5.2 di tempat sonnet atau bahkan opus untuk tugas yang lebih sederhana dan saya

00:10:02mungkin tidak akan menyadarinya. ini adalah model yang sangat mampu dan jika anda memberinya arahan yang tepat anda mendapatkan

00:10:07hasil yang sangat bagus. ini adalah salah satu model terbuka pertama yang tidak membuat saya merasa seperti saya harus berjuang

00:10:12untuk menggunakannya dan juga salah satu model terbuka pertama di mana menggunakannya saya tidak memiliki perasaan bahwa saya tahu claude

00:10:16bisa melakukan ini lebih baik atau lebih cepat. hal-hal terakhir untuk disebutkan untuk melengkapi ini adalah token, biaya, dan

00:10:21kecepatan. salah satu kelemahan glm 5.2 bisa jadi adalah sedikit lebih haus token jika dibandingkan dengan

00:10:25model lain di kelasnya. model ini menggunakan rata-rata 43.000 token per tugas yang lebih banyak daripada kimmy k 2.6

00:10:31minimax dan deep seek, tapi kabar baiknya adalah model ini tidak benar-benar memakan banyak biaya tergantung pada

00:10:37penyedianya. sekitar 1,40 dolar untuk satu juta token input dan 4,40 dolar untuk satu juta token output dan pada

00:10:41tolok ukur analisis buatan, model ini sebenarnya menelan biaya sekitar 50 sen per tugas dan anda bisa melihat ini adalah

00:10:47posisi yang cukup baik ketika kita melakukan perbandingan biaya versus kecerdasan. abaikan label gemini di sini, ini sebenarnya titik biru

00:10:52ini dan anda bisa melihat ini adalah grafik yang cukup ramai tetapi apa yang sebenarnya ditunjukkan ini adalah pada tingkat

00:10:57kecerdasannya, glm 5.2 adalah model termurah, meskipun saya akan mengatakan di sini jika anda bisa sedikit menurunkan kecerdasan

00:11:02saya pikir minimax dan terutama deep seek v4 sangat bagus untuk harga itu. ketika berbicara tentang kecepatan

00:11:07glm 5.2 sebenarnya tidak buruk sama sekali. model ini mengungguli sebagian besar model terbuka di tingkat kecerdasannya

00:11:12jadi deep seek v4 kimmy 2.7 code dan minimax dan sedikit di belakang model perbatasan seperti gemini 3.1 pro

00:11:17yang memiliki tingkat kecerdasan yang sama tetapi itu adalah model perbatasan dan saya juga ingin sekali melihat gemini

00:11:243.5 pro ditambahkan ke daftar ini. google tolong rilis itu. ketika berbicara tentang kecepatan juga, design arena

00:11:28tampaknya mendapatkan hasil yang sedikit berbeda di mana mereka mengatakan bahwa glm 5.2 mencetak skor tertinggi pada

00:11:33preferensi pengguna atas desain tersebut, tetapi itu juga yang paling lambat dari model-model teratas, meskipun juga

00:11:38perlu dicatat di sana bahwa semua model teratas itu adalah model perbatasan dan bukan model terbuka. secara keseluruhan, benar-benar

00:11:42terasa seperti kita berada di titik di mana model-model terbuka ini tertinggal empat hingga enam bulan. jadi

00:11:47mungkin terlalu optimis kita bisa melihat model fable pada tahun depan dan maksud saya mereka sendiri

00:11:51sebenarnya menjanjikan pada q1 dan saya benci setuju dengan orang berikutnya ini tentang apa pun, tetapi dia memang membuat

00:11:56poin yang bagus di sini bahwa mungkin pada tolok ukur mereka bisa mengejar fable, tetapi kegunaan yang sebenarnya terasa

00:12:01sedikit berbeda dan inilah yang sangat dikuasai anthropic. sangat jarang melihatnya benar-benar

00:12:06memberi mereka pujian di sana, tetapi saya harus setuju dengan sentimen di mana penggunaan sebenarnya

00:12:10dari model-model ini terasa sedikit berbeda, tapi saya pikir glm 5.2 adalah salah satu yang pertama yang telah memecahkan

00:12:14siklus itu bagi saya. saya pikir jika anda memberi tahu saya setahun yang lalu bahwa model-model terbuka ini akan berada di dekat

00:12:19sebagus ini, saya akan benar-benar terkejut dan mungkin tidak akan mempercayai anda dan saya sebenarnya tidak

00:12:23seorang prepper kiamat, tetapi saya merasa dengan larangan fable baru-baru ini saya hanya ingin mengunduh glm 5.2 dan menyimpannya

00:12:27di ssd untuk berjaga-jaga jika saya membutuhkannya nanti. beri tahu saya apa pendapat anda tentang model ini di komentar

00:12:31di bawah ini dan juga beri tahu saya apa model terbuka favorit anda untuk digunakan selagi anda di sana, berlangganan

00:12:36dan seperti biasa, sampai jumpa di video berikutnya.

00:12:40...

Key Takeaway

GLM 5.2 menjadi model terbuka pertama yang secara konsisten mampu menandingi performa model perbatasan seperti Claude Opus dan GPT-4o dalam tugas pengodean dan desain web dengan biaya operasional yang kompetitif.

Highlights

GLM 5.2 memiliki total 744 miliar parameter dengan 40 miliar parameter aktif.
Skor gabungan tolok ukur GLM 5.2 adalah 51, meningkat 11 poin dari iterasi sebelumnya.
GLM 5.2 menempati peringkat pertama dalam papan peringkat desain web HTML satu putaran di Design Arena, mengungguli lini Claude.
Biaya operasional GLM 5.2 mencapai sekitar 1,40 dolar untuk satu juta token input dan 4,40 dolar untuk satu juta token output.
Dalam pengujian pembuatan situs web satu halaman, GLM 5.2 menggunakan rata-rata 43.000 token per tugas.

Timeline

Analisis Performa dan Tolok Ukur

GLM 5.2 mencetak skor 51 pada indeks kecerdasan buatan gabungan.
Model ini menyamai kemampuan Gemini 3.5 Flash dan GPT-4o dalam kategori tertentu.
Performa pengodean GLM 5.2 setara dengan Gemini 3.1 Pro.

GLM 5.2 dari lab Tiongkok menunjukkan lonjakan kecerdasan yang signifikan dibandingkan pendahulunya, GLM 5.1. Analisis menunjukkan model ini unggul sebagai model terbuka teratas saat ini, dengan performa yang mampu menyaingi model berbayar papan atas pada berbagai tolok ukur seperti penalaran dan pengodean.

Kemampuan Desain UI dan Web

GLM 5.2 memuncaki papan peringkat Design Arena untuk desain web HTML.
Model ini memiliki templat ahli yang meminimalisir anti-pola desain AI umum.
Input terbatas pada modalitas teks, sehingga memerlukan perintah teks sebagai pengganti tangkapan layar.

Keunggulan utama GLM 5.2 terletak pada kemampuannya menghasilkan desain antarmuka yang bersih dan fungsional. Meski memiliki keterbatasan tidak bisa menerima input gambar langsung, hasil reka ulang situs web berdasarkan perintah teks menunjukkan kualitas visual yang sejajar dengan model-model dari Anthropic atau Kimi.

Pengujian Aplikasi dan Manajemen Data

Pembuatan aplikasi 3D satu halaman membutuhkan waktu sekitar 10 menit dengan biaya 32 sen.
GLM 5.2 secara otomatis memilih tumpukan teknologi Next.js dan Prisma untuk aplikasi manajemen keuangan.
Performa integrasi front-end dan back-end dalam satu perintah tunggal menunjukkan efektivitas tinggi.

Dalam pengujian fungsionalitas, GLM 5.2 mampu membangun aplikasi lengkap dengan konektivitas basis data tanpa instruksi spesifik. Pilihan arsitektur Next.js dan Prisma memberikan hasil yang lebih mudah ditingkatkan dibandingkan pendekatan penyimpanan memori sederhana yang dilakukan model pembanding lainnya.

Ekonomi Penggunaan dan Kesimpulan

Biaya per tugas untuk tolok ukur analisis rata-rata mencapai 50 sen.
GLM 5.2 adalah model termurah di kelas kecerdasannya.
Kecepatan pemrosesan berada sedikit di bawah model perbatasan namun melampaui model terbuka lainnya.

Efisiensi biaya menjadi nilai tambah signifikan bagi GLM 5.2, terutama mengingat tingkat kecerdasan yang ditawarkan. Model ini mewakili pergeseran di mana model terbuka mulai menghilangkan kesenjangan performa yang sebelumnya hanya bisa diisi oleh perusahaan tertutup seperti OpenAI atau Anthropic.

Community Posts

Write about this video