March 19

IBM и Hugging Face выпустили SmolDocling: 256М открытая языковая модель для OCR документов

SmolDocling – новая модель от IBM и Hugging Face для преобразования документов в структурированные данные. Она компактнее больших моделей, эффективно обрабатывает целые страницы с использованием формата DocTags и показывает высокие показатели точности в задачах OCR и распознавания кода.