Ang open source AI (o open-weight models) ay mga AI model na ang code o weights ay magagamit ng publiko para patakbuhin, suriin o baguhin. Kaiba ito sa mga saradong tool tulad ng ChatGPT na maa-access mo lamang sa pamamagitan ng kanilang serbisyo. Ipinapaliwanag ng gabay na ito kung ano ito at kung bakit mahalaga ito.
Ano ang ibig sabihin ng «open»
Sa open-weight models, ibinabahagi ng gumawa ang weights — ang natutunang halaga ng modelo — para magamit ito ng iba. Maaari mong patakbuhin ang modelo sa sarili mong makina o server, suriin kung paano ito kumikilos, at iangkop ito sa pangangailangan mo. Mga halimbawa: ang Mistral mula Europa (Apache 2.0) at ang SEA-LION na may kasamang Tagalog.
Para kanino at ano ang bentahe
Pinakamabisa ang open source AI para sa kontrol sa datos at pribasiya: maaari mong patakbuhin ang modelo nang lokal o sa sarili mong account, kaya hindi kailangang umalis ng organisasyon mo ang datos. Nasaan ang datos ko? Kapag nag-aalok ang isang US provider ng region na «sa Pilipinas», nire-resolba nito ang data residency (kung saan iniimbak ang datos) ngunit hindi tiyak ang soberanya: sa pamamagitan ng US CLOUD Act, maaaring hingin ng pamahalaan ng US ang datos mula sa mga kumpanyang kontrolado ng US kahit saan iyon iniimbak. Mabuti rin ito para sa developer at mananaliksik na gustong umunawa at mag-eksperimento.
Ang tapat na limitasyon
Walang production, consumer-grade na pambansang flagship Filipino LLM. Ang gawaing Filipino/Tagalog mula sa mga institusyong Pilipino (DOST-ASTI, ang Batayan benchmark, FiLLM) ay pananaliksik / NLP capability, hindi isang nakabalot na chat app para sa mamimili. Ang SEA-LION (AI Singapore, may kasamang Tagalog, iniulat na #1 sa Filipino sa SEA-HELM) ay isang panrehiyong open model, at ang Mistral ng Europa (open source, Apache 2.0) ay isa pang opsyon — pinakamabisa silang ituring na lapisan ng sarili mong modelo (BYO) at para sa pribasiya/soberanya, hindi dahil «mas magaling sila kaysa GPT». Ang pahayag ng vendor na ang isang modelo ay «katumbas ng GPT-4» ay marketing, hindi independiyenteng datos. Huwag magkorona ng «pinakamahusay» na Filipino model nang walang source — walang pampublikong benchmark na nagtatakda ng panalo.
Open model na ikinakabit sa daloy ng trabaho
Kung pinakamahalaga sa iyo ang kontrol sa datos, nagiging kawili-wili ang isang platform na may sariling modelo at opsyong i-self-host tulad ng osFoundry: maaaring manatili ang datos sa sarili mong account o sa sarili mong makina.
Basahin din
- Filipino AI at digital sovereignty
- Mga Filipino na AI model: pangkalahatang tanaw
- Nasaan ang data ko kapag gumagamit ng AI?
- Glosaryo ng AI
Ito ay pangkalahatang impormasyon, hindi legal o buwis na payo. Nagbabago ang mga patakaran, presyo at deadline; mangyaring tingnan ang mga opisyal na source.