Xiangyu QI

Citado por

	Total	Desde 2019
Citas	350	350
Índice h	7	7
Índice i10	7	7

180

135

20212022202320242 37 146 163

Acceso público

Ver todo

2 artículos

0 artículos

disponibles

no disponibles

Basado en requisitos de financiación

Coautores

Prateek MittalProfessor, Princeton UniversityDirección de correo verificada de princeton.edu
Saeed MahloujifarFAIR, MetaDirección de correo verificada de meta.com
Peter HendersonPrinceton UniversityDirección de correo verificada de princeton.edu
Mengdi WangCenter for Statistics & Machine Learning, ECE, Princeton UniversityDirección de correo verificada de princeton.edu
Pin-Yu ChenPrincipal Research Scientist, IBM Research AI; MIT-IBM Watson AI Lab; RPI-IBM AIRCDirección de correo verificada de ibm.com
Ruoxi JiaAssistant Professor, Virginia TechDirección de correo verificada de vt.edu
Kai BuZhejiang UniversityDirección de correo verificada de zju.edu.cn
Bo LiUniversity of Illinois at Urbana–ChampaignDirección de correo verificada de illinois.edu
Nezihe Merve GürelAssistant Professor at TU DelftDirección de correo verificada de stanford.edu
Ce ZhangTogether AIDirección de correo verificada de together.xyz
Chaowei XiaoUniversity of Wisconsin - MadisonDirección de correo verificada de umich.edu

Seguir

Xiangyu QI

Princeton University

Dirección de correo verificada de princeton.edu - Página principal


Título Ordenar por citas Ordenar por año Ordenar por título	Citado por Citado por	Año
Fine-tuning aligned language models compromises safety, even when users do not intend to! X Qi, Y Zeng, T Xie, PY Chen, R Jia, P Mittal, P Henderson International Conference on Learning Representations (ICLR), 2024 (Oral), 2023	96	2023
Visual Adversarial Examples Jailbreak Aligned Large Language Models X Qi, K Huang, A Panda, P Henderson, M Wang, P Mittal AAAI Conference on Artificial Intelligence, 2024 (Oral), 2023	67*	2023
Revisiting the assumption of latent separability for backdoor defenses X Qi, T Xie, Y Li, S Mahloujifar, P Mittal International Conference on Learning Representations (ICLR), 2023, 2023	65*	2023
Towards Practical Deployment-Stage Backdoor Attack on Deep Neural Networks X Qi, T Xie, R Pan, J Zhu, Y Yang, K Bu Conference on Computer Vision and Pattern Recognition (CVPR), 2022 (Oral), 2021	44	2021
Knowledge Enhanced Machine Learning Pipeline against Diverse Adversarial Attacks NM Gürel, X Qi, L Rimanic, C Zhang, B Li International Conference on Machine Learning (ICML), 2021, 2021	29	2021
Subnet Replacement: Deployment-stage backdoor attack against deep neural networks in gray-box setting X Qi, J Zhu, C Xie, Y Yang ICLR Workshop, 2021	24	2021
Towards A Proactive {ML} Approach for Detecting Backdoor Poison Samples X Qi, T Xie, JT Wang, T Wu, S Mahloujifar, P Mittal 32nd USENIX Security Symposium (USENIX Security 23), 1685-1702, 2023	16*	2023
Assessing the brittleness of safety alignment via pruning and low-rank modifications B Wei, K Huang, Y Huang, T Xie, X Qi, M Xia, P Mittal, M Wang, ... arXiv preprint arXiv:2402.05162, 2024	4	2024
Uncovering Adversarial Risks of Test-Time Adaptation T Wu, F Jia, X Qi, JT Wang, V Sehwag, S Mahloujifar, P Mittal International Conference on Machine Learning (ICML), 2023, 2023	4	2023
BaDExpert: Extracting Backdoor Functionality for Accurate Backdoor Input Detection T Xie, X Qi, P He, Y Li, JT Wang, P Mittal International Conference on Learning Representations (ICLR), 2024, 2023	1	2023
Mitigating Fine-tuning Jailbreak Attack with Backdoor Enhanced Alignment J Wang, J Li, Y Li, X Qi, M Chen, J Hu, Y Li, B Li, C Xiao arXiv preprint arXiv:2402.14968, 2024		2024

El sistema no puede realizar la operación en estos momentos. Inténtalo de nuevo más tarde.

Artículos 1–11

Citas por año

Citas duplicadas

Citas combinadas

Añadir coautoresCoautores

Seguir

Citado por

Coautores