Junjie Wang

xiaomoguhzz

·

xiaomoguhz

AI & ML interests

computer vision, Vision-Language Models, Multimodal Large Language Models

Recent Activity

updated a dataset 6 days ago

xiaomoguhzz/codex-ppt-temp-visual-encoder-assets

published a dataset 6 days ago

xiaomoguhzz/codex-ppt-temp-visual-encoder-assets

upvoted a paper 10 days ago

UnityShots: Memory-Driven Multi-Shot Audio-Video Generation with Boundary-Aware Gating

View all activity

Organizations

Papers 1

arxiv:2505.04410

models 8

xiaomoguhzz/VisionEncoder

Updated 13 days ago

xiaomoguhzz/bagelthink

xiaomoguhzz/DeCLIP2_EVA-B_DINOv2-B_csa_560_plus_sd0.3_0.1_2.0_0.3

Updated Jul 1, 2025

xiaomoguhzz/DeCLIP_EVA-L_DINOv2-L_csa_0.05_2.0

Updated Jun 10, 2025

xiaomoguhzz/CATSeg_DeCLIP_EVA-L_DINOv2-L_csa_0.05_2.0

Updated Jun 10, 2025

xiaomoguhzz/DeCLIP_EVA-B_DINOv2-B_csa_0.05_2.0

Updated May 20, 2025

xiaomoguhzz/CATSeg_DeCLIP_EVA-B_DINOv2-B_csa_0.05_2.0

Updated May 20, 2025

xiaomoguhzz/DeCLIP_evab_dinov2B_csa_560_0.25_seg

Updated May 11, 2025

datasets 5

xiaomoguhzz/codex-ppt-temp-visual-encoder-assets

Viewer • Updated 6 days ago • 20 • 94

xiaomoguhzz/catseg_detectron2_data

Updated 12 days ago • 52

xiaomoguhzz/general_backup

Updated 14 days ago • 48

xiaomoguhzz/zijie_backup

Updated 26 days ago • 557

xiaomoguhzz/journal_backup_ckpt

Updated 28 days ago • 1.28k