Ang ibig sabihin ng LLM ay Large Language Model — malaking modelo ng wika. Ito ay isang uri ng AI na sinanay sa napakaraming teksto upang maunawaan at makagawa nito ng wika ng tao. Ang LLM ang «makina» sa likod ng mga chatbot tulad ng ChatGPT, Gemini at Claude.
Paano gumagana ang LLM
Natututo ang LLM sa pamamagitan ng paulit-ulit na paghula ng susunod na salita sa isang pangungusap, sa napakaraming teksto. Unti-unti nitong natututunan ang gramatika, mga datos at pattern ng pangangatwiran. Kapag binigyan mo ito ng utos, gumagawa ito ng sagot nang isang token sa bawat pagkakataon — ang token ay isang piraso ng teksto (salita o bahagi ng salita).
Mga LLM na kilala mo
Ang ChatGPT (OpenAI), Gemini (Google), Claude (Anthropic) at Le Chat (Mistral, Europa) ay pawang nakabatay sa LLM. May mga open source na LLM rin na maaaring patakbuhin nang mag-isa. Walang production, consumer-grade na pambansang flagship Filipino LLM. Ang gawaing Filipino/Tagalog mula sa mga institusyong Pilipino (DOST-ASTI, ang Batayan benchmark, FiLLM) ay pananaliksik / NLP capability, hindi isang nakabalot na chat app para sa mamimili. Ang SEA-LION (AI Singapore, may kasamang Tagalog, iniulat na #1 sa Filipino sa SEA-HELM) ay isang panrehiyong open model, at ang Mistral ng Europa (open source, Apache 2.0) ay isa pang opsyon — pinakamabisa silang ituring na lapisan ng sarili mong modelo (BYO) at para sa pribasiya/soberanya, hindi dahil «mas magaling sila kaysa GPT». Ang pahayag ng vendor na ang isang modelo ay «katumbas ng GPT-4» ay marketing, hindi independiyenteng datos. Huwag magkorona ng «pinakamahusay» na Filipino model nang walang source — walang pampublikong benchmark na nagtatakda ng panalo.
Mga limitasyon ng LLM
Maaaring mag-imbento ng impormasyon ang AI sa paraang napaka-kapani-paniwala (hallucination). Laging i-double-check ang mahahalagang datos sa mapagkakatiwalaang source. Hindi rin alam ng LLM ang mga pangyayari pagkatapos ng training data nito maliban kung nakakabit ito sa web search.
Paggamit ng sarili mong modelo
Kung pinakamahalaga sa iyo ang kontrol sa datos, nagiging kawili-wili ang isang platform na may sariling modelo at opsyong i-self-host tulad ng osFoundry: maaaring manatili ang datos sa sarili mong account o sa sarili mong makina.
Basahin din
- Ano ang token sa AI?
- Ano ang ChatGPT?
- Ano ang AI model?
- Filipino AI at digital sovereignty
- SEA-LION: review
Ito ay pangkalahatang impormasyon, hindi legal o buwis na payo. Nagbabago ang mga patakaran, presyo at deadline; mangyaring tingnan ang mga opisyal na source.