grobid — ML-система для разбора научных PDF-статей: извлекает метаданные, библиографические ссылки, полный текст, таблицы и формулы. Использует CRF, deep learning и трансформеры. Широко применяется в academic search и digital libraries. (⭐4.8k, Java)