Yunhao Tang

Citado por

	Total	Desde 2019
Citas	2473	2464
Índice h	19	19
Índice i10	28	28

1600

800

400

1200

20182019202020212022202320247 40 126 185 241 354 1511

Acceso público

Ver todo

5 artículos

0 artículos

disponibles

no disponibles

Basado en requisitos de financiación

Coautores

Rémi MunosGoogle DeepMindDirección de correo verificada de inria.fr
Michal ValkoLlama @ Meta Paris & Inria & MVA - Ex: Gemini and BYOL @ Google DeepMindDirección de correo verificada de meta.com
Krzysztof ChoromanskiGoogle Brain Robotics New York & Columbia UniversityDirección de correo verificada de columbia.edu
Mark RowlandResearch Scientist, Google DeepMindDirección de correo verificada de google.com
Aldo PacchianoBroad Institute of MIT and HarvardDirección de correo verificada de broadinstitute.org
Will DabneyDeepMindDirección de correo verificada de google.com
Zhaohan Daniel GuoDeepMindDirección de correo verificada de google.com
Daniele CalandrielloResearch Scientist, DeepMindDirección de correo verificada de google.com
Bilal PiotGoogle DeepmindDirección de correo verificada de google.com
Mohammad Gheshlaghi AzarCohereDirección de correo verificada de google.com
Shipra AgrawalColumbia universityDirección de correo verificada de columbia.edu
Tadashi KozunoOMRON SINIC XDirección de correo verificada de alumni.oist.jp
Tamás SarlósGoogleDirección de correo verificada de google.com
Vikas SindhwaniGoogle DeepMind RoboticsDirección de correo verificada de google.com
Wenbo GaoColumbia UniversityDirección de correo verificada de columbia.edu
Florent AltchéResearch Engineer, DeepMindDirección de correo verificada de google.com
Marc G. BellemareReliant AI, prev. Google Brain, DeepMindDirección de correo verificada de reliant.ai
Yuri FaenzaAssociate Professor, IEOR, Columbia UniversityDirección de correo verificada de columbia.edu
Alp KucukelbirAdjunct Professor of Computer Science, Columbia UniversityDirección de correo verificada de cs.columbia.edu
Adrian WellerDirector of Research, Machine Learning, University of CambridgeDirección de correo verificada de eng.cam.ac.uk

Seguir

Yunhao Tang

Research Scientist, DeepMind

Dirección de correo verificada de columbia.edu - Página principal

Reinforcement Learning


Título Ordenar por citas Ordenar por año Ordenar por título	Citado por Citado por	Año
Gemini: a family of highly capable multimodal models G Team, R Anil, S Borgeaud, Y Wu, JB Alayrac, J Yu, R Soricut, ... arXiv preprint arXiv:2312.11805, 2023	1042	2023
Reinforcement learning for integer programming: Learning to cut Y Tang, S Agrawal, Y Faenza International conference on machine learning, 9367-9376, 2020	203	2020
Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context M Reid, N Savinov, D Teplyashin, D Lepikhin, T Lillicrap, J Alayrac, ... arXiv preprint arXiv:2403.05530, 2024	196	2024
Es-maml: Simple hessian-free meta learning X Song, W Gao, Y Yang, K Choromanski, A Pacchiano, Y Tang arXiv preprint arXiv:1910.01215, 2019	132	2019
Discretizing continuous action space for on-policy optimization Y Tang, S Agrawal Proceedings of the aaai conference on artificial intelligence 34 (04), 5981-5988, 2020	121	2020
Monte-Carlo tree search as regularized policy optimization JB Grill, F Altché, Y Tang, T Hubert, M Valko, I Antonoglou, R Munos International Conference on Machine Learning, 3769-3778, 2020	73	2020
Byol-explore: Exploration by bootstrapped prediction Z Guo, S Thakoor, M Pîslar, B Avila Pires, F Altché, C Tallec, A Saade, ... Advances in neural information processing systems 35, 31855-31870, 2022	58	2022
From complexity to simplicity: Adaptive es-active subspaces for blackbox optimization KM Choromanski, A Pacchiano, J Parker-Holder, Y Tang, V Sindhwani Advances in Neural Information Processing Systems 32, 2019	50	2019
Orthogonal estimation of Wasserstein distances M Rowland, J Hron, Y Tang, K Choromanski, T Sarlos, A Weller The 22nd International Conference on Artificial Intelligence and Statistics …, 2019	47	2019
Nash learning from human feedback R Munos, M Valko, D Calandriello, MG Azar, M Rowland, ZD Guo, Y Tang, ... arXiv preprint arXiv:2312.00886, 2023	46	2023
Provably robust blackbox optimization for reinforcement learning K Choromanski, A Pacchiano, J Parker-Holder, Y Tang, D Jain, Y Yang, ... CoRR, abs/1903.02993, 2019	42	2019
Learning to Score Behaviors for Guided Policy Optimization A Pacchiano, J Parker-Holder, Y Tang, A Choromanska, K Choromanski, ... arXiv preprint arXiv:1906.04349, 2019	41	2019
Exploration by distributional reinforcement learning Y Tang, S Agrawal arXiv preprint arXiv:1805.01907, 2018	40	2018
Boosting trust region policy optimization by normalizing flows policy Y Tang, S Agrawal arXiv preprint arXiv:1809.10326, 2018	33	2018
Understanding self-predictive learning for reinforcement learning Y Tang, ZD Guo, PH Richemond, BA Pires, Y Chandak, R Munos, ... International Conference on Machine Learning, 33632-33656, 2023	27	2023
Generalized preference optimization: A unified approach to offline alignment Y Tang, ZD Guo, Z Zheng, D Calandriello, R Munos, M Rowland, ... arXiv preprint arXiv:2402.05749, 2024	23	2024
Self-imitation learning via generalized lower bound q-learning Y Tang Advances in neural information processing systems 33, 13964-13975, 2020	23	2020
Revisiting Peng’s Q() for Modern Reinforcement Learning T Kozuno, Y Tang, M Rowland, R Munos, S Kapturowski, W Dabney, ... International Conference on Machine Learning, 5794-5804, 2021	22	2021
Taylor expansion policy optimization Y Tang, M Valko, R Munos International Conference on Machine Learning, 9397-9406, 2020	20	2020
Hindsight expectation maximization for goal-conditioned reinforcement learning Y Tang, A Kucukelbir International Conference on Artificial Intelligence and Statistics, 2863-2871, 2021	19	2021

El sistema no puede realizar la operación en estos momentos. Inténtalo de nuevo más tarde.

Artículos 1–20

Citas por año

Citas duplicadas

Citas combinadas

Añadir coautoresCoautores

Seguir

Citado por

Coautores