Publications

Jiyoung Lee, Song Park, Sanghyuk Chun, Soo-Whan Chung (2025). Seeing What You Say: Expressive Image Generation from Speech. Proceedings of the IEEE international conference on computer vision workshops.

Sanghyuk Chun, Wonjae Kim, Song Park, Sangdoo Yun (2025). Probabilistic Language-Image Pre-Training. International Conference on Representation Learning.

Minhyun Lee, Seungho Lee, Song Park, Dongyoon Han, Byeongho Heo, Hyunjung Shim (2025). MaskRIS: Semantic Distortion-aware Data Augmentation for Referring Image Segmentation. Transactions on Machine Learning Research.

Song Park, Sanghyuk Chun, Byeongho Heo, Dongyoon Han (2025). DNNs May Determine Major Properties of Their Outputs Early, with Timing Possibly Driven by Bias. arXiv preprint arXiv:2502.08167.

Jaehui Hwang, Dongyoon Han, Byeongho Heo, Song Park, Sanghyuk Chun, Jong-Seok Lee (2024). Similarity of neural architectures using adversarial attack transferability. European Conference on Computer Vision.

Minhyun Lee, Song Park, Byeongho Heo, Dongyoon Han, Hyunjung Shim (2024). SeiT++: Masked Token Modeling Improves Storage-efficient Training. European Conference on Computer Vision.

Byeongho Heo, Song Park, Dongyoon Han, Sangdoo Yun (2024). Rotary position embedding for vision transformer. European Conference on Computer Vision.

NaHyeon Park, Kunhee Kim, Song Park, Jung-Woo Ha, Hyunjung Shim (2023). TADA: Timestep-Aware Data Augmentation for Diffusion Models. NeurIPS Workshop.

Song Park, Sanghyuk Chun, Byeongho Heo, Wonjae Kim, Sangdoo Yun (2023). SeiT: Storage-efficient vision training with tokens using 1% of pixel storage. Proceedings of the IEEE/CVF International Conference on Computer Vision.

Song Park, Sanghyuk Chun, Junbum Cha, Bado Lee, Hyunjung Shim (2022). Few-shot font generation with weakly supervised localized representations. IEEE transactions on pattern analysis and machine intelligence.