Zeming Wei

Citado por

	Total	Desde 2019
Citas	110	110
Índice h	6	6
Índice i10	3	3

2023202439 71

Acceso público

Ver todo

3 artículos

0 artículos

disponibles

no disponibles

Basado en requisitos de financiación

Coautores

Yifei WangPostdoc, MITDirección de correo verificada de mit.edu
Yihao ZhangPeking UniversityDirección de correo verificada de stu.pku.edu.cn
Meng SunProfessor, School of Mathematical Science, Peking UniversityDirección de correo verificada de math.pku.edu.cn
Xiyue ZhangUniversity of OxfordDirección de correo verificada de cs.ox.ac.uk
Jingyu ZhuDirección de correo verificada de stu.pku.edu.cn
Chawin SitawarinPostdoctoral Researcher @ MetaDirección de correo verificada de meta.com
David WagnerProfessor of Computer Science, UC BerkeleyDirección de correo verificada de cs.berkeley.edu
Julien PietUC BerkeleyDirección de correo verificada de berkeley.edu
Yichuan MoPh.D. Student, Peking UniversityDirección de correo verificada de stu.pku.edu.cn
Huanran ChenUndergraduate, Beijing Institute of TechnologyDirección de correo verificada de bit.edu.cn
Hangzhou HePeking UniversityDirección de correo verificada de stu.pku.edu.cn
Sun JunProfessor of SCIS, SMUDirección de correo verificada de smu.edu.sg
Stefanie JegelkaTUM and MITDirección de correo verificada de mit.edu

Seguir

Zeming Wei

Undergraduate, Peking University

Dirección de correo verificada de stu.pku.edu.cn - Página principal

Trustworthy AI Adversarial Robustness Explainability


Título Ordenar por citas Ordenar por año Ordenar por título	Citado por Citado por	Año
Jailbreak and Guard Aligned Language Models with Only Few In-Context Demonstrations Z Wei, Y Wang, Y Wang arXiv preprint arXiv:2310.06387, 2023	43	2023
CFA: Class-wise Calibrated Fair Adversarial Training Z Wei, Y Wang, Y Guo, Y Wang CVPR 2023, 2023	25	2023
Jatmo: Prompt injection defense by task-specific finetuning J Piet, M Alrashed, C Sitawarin, S Chen, Z Wei, B Alomair, D Wagner ESORICS 2024, 2024	10	2024
Sharpness-Aware Minimization Alone can Improve Adversarial Robustness Z Wei✉️, J Zhu, Y Zhang ICML 2023 Workshop on New Frontiers in Adversarial Machine Learning, 2023	8*	2023
Using Z3 for Formal Modeling and Verification of FNN Global Robustness Y Zhang, Z Wei, X Zhang, M Sun SEKE 2023, 2023	6	2023
Extracting Weighted Finite Automata from Recurrent Neural Networks for Natural Languages Z Wei, X Zhang, M Sun ICFEM 2022, 2022	6	2022
Fight back against jailbreaking via prompt adversarial tuning Y Mo, Y Wang, Z Wei, Y Wang ICLR 2024 Workshop on Secure and Trustworthy Large Language Models, 2024	3*	2024
Architecture Matters: Uncovering Implicit Mechanisms in Graph Contrastive Learning X Guo, Y Wang, Z Wei, Y Wang NeurIPS 2023, 2023	3	2023
Weighted Automata Extraction and Explanation of Recurrent Neural Networks for Natural Language Tasks Z Wei, X Zhang, Y Zhang, M Sun Journal of Logical and Algebraic Methods in Programming 136, 100907, 2023	3	2023
On the Duality Between Sharpness-Aware Minimization and Adversarial Training Y Zhang, H He, J Zhu, H Chen, Y Wang, Z Wei✉️ arXiv preprint arXiv:2402.15152, 2024	2	2024
Characterizing Robust Overfitting in Adversarial Training via Cross-Class Features Z Wei, Y Guo, Y Wang OpenReview preprint, 2023	1	2023
Towards General Conceptual Model Editing via Adversarial Representation Engineering Y Zhang, Z Wei, J Sun, M Sun arXiv preprint arXiv:2404.13752, 2024		2024

El sistema no puede realizar la operación en estos momentos. Inténtalo de nuevo más tarde.

Artículos 1–12

Citas por año

Citas duplicadas

Citas combinadas

Añadir coautoresCoautores

Seguir

Citado por

Coautores