Minseon Kim

Publication (*equal contribution)

Rethinking Safety in LLM Fine-tuning: An Optimization Perspective
Minseon Kim, Jin Myung Kwak, Lama Alssum, Bernard Ghanem, Philip Torr, David Krueger, Fazl Barez, Adel Bibi
CoLM 2025, PDF

Exploring Sparse Adapters for Scalable Merging of Parameter Efficient Experts
Samin Yeasar Arnob, Zhan Su, Minseon Kim, Oleksiy Ostapenko, Doina Precup, Lucas Caccia, Alessandro Sordoni
CoLM 2025, PDF

Medical Red Teaming Protocol of Language Models: On the Importance of User Perspectives in Healthcare Settings
Minseon Kim*, Jean-Philippe Corbeil*, Alessandro Sordoni, Francois Beaulieu, Paul Vozila
Arxiv 2025, PDF

Instilling Parallel Reasoning into Language Models
Matthew Macfarlane, Minseon Kim, Nebojsa Jojic, Weijia Xu, Lucas Caccia, Xingdi Yuan, Wanru Zhao, Zhengyan Shi, Alessandro Sordoni
ICML AI for Math Workshop 2025, PDF

Learning to Solve Complex Problems via Dataset Decomposition
Wanru Zhao, Lucas Caccia, Zhengyan Shi, Minseon Kim, Xingdi Yuan, Weijia Xu, Marc-Alexandre Côté, Alessandro Sordoni
ICML AI for Math Workshop 2025, PDF

Enhancing Variational Autoencoders with Smooth Robust Latent Encoding
Hyomin Lee*, Minseon Kim*, Sangwon Jang, Jongheon Jeong, Sung Ju Hwang
ArXiv 2025, PDF

debug-gym: A Text-Based Environment for Interactive Debugging
Xingdi Yuan, Morgane M Moss, Charbel El Feghali, Chinmay Singh, Darya Moldavskaya, Drew MacPhee, Lucas Caccia, Matheus Pereira, Minseon Kim, Alessandro Sordoni, Marc-Alexandre Côté
ArXiv 2025, PDF

Automatic Jailbreaking of the Text-to-Image Generative AI Systems
Minseon Kim, Hyomin Lee, Boqing Gong, Huishuai Zhang, Sung Ju Hwang
ICML Next Generation of AI Safety Workshop 2024, PDF, Project Page, Code

Optimizing Query Generation for Enhanced Document Retrieval in RAG
Hamin Koo, Minseon Kim, Sung Ju Hwang
Arxiv 2024, PDF

Protein Representation Learning by Capturing Protein Sequence-Structure-Function Relationship
Eunji Ko*, Seul Lee*, Minseon Kim*, Dongki Kim, Sung Ju Hwang
ICLR MLGenX workshop 2024 (Spotlight), PDF

Effective Targeted Attacks for Adversarial Self-Supervised Learning
Minseon Kim, Hyeonjeong Ha, Sooel Son, Sung Ju Hwang
NeurIPS 2023, PDF, Code

Generalizable Lightweight Proxy for Robust NAS against Diverse Perturbations
Hyeonjeong Ha*, Minseon Kim*, Sung Ju Hwang
NeurIPS 2023, PDF, Code

Language Detoxification with Attribute-Discriminative Latent Space
Minseon Kim*, Jin Myung Kwak*, Sung Ju Hwang
ACL 2023, PDF

Context-dependent Instruction Tuning for Dialogue Response Generation
Jin Myung Kwak, Minseon Kim, Sung Ju Hwang
ArXiv 2023, PDF

Meta-Prediction Model for Distillation-aware NAS on Unseen Datasets
Hayeon Lee*, Sohyun An*, Minseon Kim, Sung Ju Hwang
ICLR 2023 (Spotlight), PDF, Code

Rethinking the Entropy of Instance in Adversarial Training
Minseon Kim, Jihoon Tack, Jinwoo Shin, Sung Ju Hwang
IEEE SaTML 2023, PDF, Code

Lightweight Neural Architecture Search with Parameter Remapping and Knowledge Distillation
Hayeon Lee*, Sohyun An*, Minseon Kim, Sung Ju Hwang
AutoML workshop 2022, PDF

Learning Transferable Adversarial Robust Representations via Multi-view Consistency
Minseon Kim*, Hyeonjeong Ha*, Dong Bok Lee, Sung Ju Hwang
NeurIPS SafetyML workshop 2022, PDF

Consistency Regularization for Adversarial Robustness
Jihoon Tack, Sihyun Yu, Jongheon Jeong, Minseon Kim, Sung Ju Hwang, and Jinwoo Shin
AAAI 2022, PDF, Code

MRI-based classification of neuropsychiatric systemic lupus erythematosus patients with self-supervised contrastive learning
M. Kim*, F. Inglese*, G. Steup-Beekman, T. Huizinga, M. Van Buchem, J. Bresser, D. Kim, I. Ronen
Frontiers in Neuroscience 2022 (Impact Factor: 4.67), PDF

Adversarial Self-Supervised Contrastive Learning
Minseon Kim, Jihoon Tack, Sungju Hwang
NeurIPS 2020, PDF, Code

Progressive Face Super-Resolution via Attention to Facial Landmark
Deokyun Kim*, Minseon Kim*, Gihyun Kwon*, Daeshik Kim
BMVC 2019, PDF, Code

T1 Image Synthesis with Deep Convolutional Generative Adversarial Networks
Minseon Kim, Chihye Han, Jisuk Park, Dae-Shik Kim
OHBM 2018

Presented Talk

Invited talk
"Unsupervised Context Understanding for Safer LLMs"

Women in MSR – Project Green , MSR, Mar. 2025

"Designing safety systems for LLM-based services"

Tea Talk, Mila, Feb. 2025

"How to obtain safety effectively and efficiently"

RWE AI Journal Club, Microsoft, Nov. 2024

"Automatic Jailbreaking of the Text-to-Image Generative AI Systems"

Guest Lecture, Korea University, May. 2024

"Effective Targeted Attacks for Adversarial Self-Supervised Learning"

Samsung AI Forum 2023, Samsung, Nov. 2023

"Generalizable Lightweight Proxy for Robust NAS against Diverse Perturbations"

R&D AI Conference, Hyundai, Nov. 2023

"Adversarial Self-Supervised Contrastive Learning"

Stella Yu's Group, UC Berkeley, Nov. 2020
NeurIPS Social: ML in Korea, Dec. 2020
Korea Software Congress (KSC): Korea Post-NeurIPS-2020 Workshop, Dec. 2020
Kakao Brain, Feb. 2021
Korean Conference on Computer Vision, Aug. 2021

"MRI-based classification of neuropsychiatric systemic lupus erythematosus patients with self-supervised contrastive learning"

ESMRMB (Lightening Talk), Sep. 2020

"Deep neural network from CNN to GAN"

LUMC, Aug. 2019

Academic Activity

Conference reviewer

International Conference on Machine Learning (ICML): 2021-2025
Conference on Neural Information Processing Systems (NeurIPS): 2021-2025
International Conference on Computer Vision (ICCV): 2025
International Conference on Learning Representations (ICLR): 2022-2024
Association for Computational Linguistics (ACL) ARR: 2022-2023
AAAI Safe, Robust and Responsible AI (SRRAI): 2023
AAAI Workshop on Representation learning for Responsible Human-Centric AI (Area Chair): 2023
Association for the Advancement of Artificial Intelligence (AAAI): 2020-2021
Asian Conference on Machine Learning (ACML): 2020-2021

Journal reviewer

Transactions on Information Forensics & Security
Transactions on Pattern Analysis and Machine Intelligence
IEEE Computational Intelligence Magazine
IEEE Transactions on Neural Networks and Learning Systems
Neural Computing and Applications
Machine Learning
Transactions on Machine Learning Research
Asian Conference on Machine Learning Journal Track

Organizer

Women in EE/CS/AI @ KAIST, 2024 Summer
AI Safety Colloquium, 2024 Spring
Women in AI @ KAIST, 2022 Summer

Publication (*equal contribution)

Experience

Presented Talk

Academic Activity

Education

Contact