Railey Montalan

mananaliksík • 🇵🇭 in 🇸🇬

railey-20250818.png

Hi!

I am an AI researcher and engineer for AI Singapore. I focus on evaluating the cultural representation and reasoning capabilities of large language models (LLMs) in Filipino and other Southeast Asian languages through SEA-HELM. I also help develop SEA-LION, our collection of multingual LLMs and ancillary models for safety and embedding optimized for Southeast Asia. I previously worked on Aquarium (now called Project Atlas), our open-source data hub.

Prior to AI Singapore, I taught NLP electives in Ateneo de Manila University and worked in the business intelligence industry.


Kumustá?

Isá akóng AI researcher at engineer sa AI Singapore. Nagfofókus ako sa pagsusurì ng representasyóng kulturál at kakayaháng pangkatwíran ng mga large language model (LLM) sa Filipíno at ibá pang wikà sa Tímog-Silángang Ásya sa pamamagítan ng SEA-HELM. Kasáma rin akó sa pagbuô sa SEA-LION, ang amíng koleksiyón ng mga multilingual na LLM at mga kaugnáy na modélo pára sa kaligtásan at embedding na in-optimize pára sa Tímog-Silángang Ásya. Tumúlong din akó sa Aquarium (kilalá ngayón bílang Project Atlas), ang amíng open-source na data hub.

Bágo akó napuntá sa AI Singapore, nagtúro akó ng mga elective sa NLP sa Ateneo de Manila University at nagtrabáho rin akó sa business intelligence industry.

news

28 May 2026 More wins for Southeast Asia: our paper on expanding evaluations to Burmese was presented at LREC 2026! And last month, we released our collection of embedding models optimized for SEA languages; this work will be presented at ACL 2026 in July.
Panálo na namán ang Tímog-Silángang Ásya: ibinahági namín ang áming papél sa pagpapaláwak ng pagsusurì pára sa Burmese sa LREC 2026! At sa nakaraáng buwán, inilabás námin ang áming koleksiyón ng mga embedding model na in-optimize pára sa mga wikà ng SEA; ipepresentá ang akdâng itó sa ACL 2026 sa Húlyo.
20 May 2026 Version 4.5 of SEA-LION was released today! These were built upon the Qwen 3.6 27B and Gemma 4 E2B architectures, and underwent distillation from stronger models using our SEA instruction-tuning dataset to increase their multilingual and multicultural fluency. Try them out here today!
Inilabás ngayón ang bersiyón 4.5 ng SEA-LION! Nakabáse ang mga itó sa arkitektúra ng Qwen 3.6 27B at Gemma 4 E2B. Lálong pinahusáy ang kakayaháng multilingual at multicultural ng mga itó sa pamamagítan ng distillation mulâ sa mas malakás na modélo gámit ang áming SEA instruction-tuning dataset. Subúkan ang mga itò ngayón!.
22 Jan 2026 Our SEA-LION v3 paper is now available on ACL Anthology. We’ve also released v4 models of SEA-LION built on Gemma 3 and Qwen 3 on HuggingFace and Ollama.
Mahahánap na ang áming papél tungkól sa SEA-LION v3 sa ACL Anthology. Inilabás na rin namín ang mga v4 modl ng SEA-LION na hangò sa Gemma 3 at Qwen 3 sa HuggingFace at sa Ollama.
27 Oct 2025 Our paper, where we introduce our pre-training and post-training regimes for our multilingual SEA-LION v3 models, was accepted at IJCNLP-AACL 2026 Main! Congratulations to the ARF team!
Tinanggáp ang áming papél, kung saán inilahád námin ang áming paraán ng pre-training at post-training pára sa áming mga multílingguwál na modélong SEA-LION v3, sa IJCNLP-AACL 2026 Main! Binabatì ko ang ARF team!
01 Aug 2025 We presented our Batayan and SEA-HELM studies at ACL 2025 in Vienna!
Ibinahági namín ang Batayan at SEA-HELM sa ACL 2025 sa Vienna!