data pruning tag

Gwern Branwen

See Also
Links
Miscellaneous
Link Bibliography

[Warning: JavaScript Disabled!]

[For support of key website features (link annotation popups/popovers & transclusions, collapsible sections, backlinks, tablesorting, image zooming, sidenotes etc), you must enable JavaScript.]

Links

“How to Train Data-Efficient LLMs”, Sachdeva et al 2024

How to Train Data-Efficient LLMs

“Bad Students Make Great Teachers: Active Learning Accelerates Large-Scale Visual Understanding”, Evans et al 2023

Bad Students Make Great Teachers: Active Learning Accelerates Large-Scale Visual Understanding

“Does CLIP’s Generalization Performance Mainly Stem from High Train-Test Similarity?”, Mayilvahanan et al 2023

Does CLIP’s Generalization Performance Mainly Stem from High Train-Test Similarity?

“Data Filtering Networks”, Fang et al 2023

Data Filtering Networks

“SlimPajama-DC: Understanding Data Combinations for LLM Training”, Shen et al 2023

SlimPajama-DC: Understanding Data Combinations for LLM Training

“Anchor Points: Benchmarking Models With Much Fewer Examples”, Vivek et al 2023

Anchor Points: Benchmarking Models with Much Fewer Examples

“When Less Is More: Investigating Data Pruning for Pretraining LLMs at Scale”, Marion et al 2023

When Less is More: Investigating Data Pruning for Pretraining LLMs at Scale

“Beyond Neural Scaling Laws: Beating Power Law Scaling via Data Pruning”, Sorscher et al 2022

Beyond neural scaling laws: beating power law scaling via data pruning

“Unadversarial Examples: Designing Objects for Robust Vision”, Salman et al 2020

Unadversarial Examples: Designing Objects for Robust Vision

“Generative Models Are Unsupervised Predictors of Page Quality: A Colossal-Scale Study”, Bahri et al 2020

Generative Models are Unsupervised Predictors of Page Quality: A Colossal-Scale Study

Wikipedia

Coreset⁠:

https://en.wikipedia.org/wiki/Coreset

Miscellaneous

https://aclanthology.org/2023.findings-emnlp.18/⁠:

View External Link:

https://aclanthology.org/2023.findings-emnlp.18/

Link Bibliography

https://arxiv.org/abs/2312.05328#deepmind: “Bad Students Make Great Teachers: Active Learning Accelerates Large-Scale Visual Understanding”, Talfan Evans, Shreya Pathak, Hamza Merzic, Jonathan Schwarz, Ryutaro Tanno, Olivier J. Henaff

link-bibliography
https://arxiv.org/abs/2309.17425#apple: “Data Filtering Networks”, Alex Fang, Albin Madappally Jose, Amit Jain, Ludwig Schmidt, Alexander Toshev, Vaishaal Shankar

link-bibliography
https://arxiv.org/abs/2309.10818#cerebras: “SlimPajama-DC: Understanding Data Combinations for LLM Training”, Zhiqiang Shen, Tianhua Tao, Liqun Ma, Willie Neiswanger, Zhengzhong Liu, Hongyi Wang, Bowen Tan, Joel Hestness, Natalia Vassilieva, Daria Soboleva, Eric Xing

link-bibliography
https://arxiv.org/abs/2206.14486: “Beyond Neural Scaling Laws: Beating Power Law Scaling via Data Pruning”, Ben Sorscher, Robert Geirhos, Shashank Shekhar, Surya Ganguli, Ari S. Morcos

link-bibliography

[Quote Of The Day]

[Site Of The Day]

[Annotation Of The Day]

[adblock public service announcement]