В Гарвардском университете собрали по-настоящему большую базу данных

В Гарвардском университете выполнили колоссальную работу. За относительно небольшой промежуток времени было отсканировано и выложено в сеть для последующего обучения ИИ порядка 6 миллионов судебных дел.

Гарвардская библиотека Школы Права за пять лет непрерывной работы смогла перевести в цифровой формат все судебные дела, которые были оформлены на бумаге в США, начиная с 1600-х годов и заканчивая летом этого года. Всего было отсканировано порядка 40 миллионов страниц. Как сообщает MIT Technology Review теперь со всеми этими делами можно познакомиться в режиме онлайн.

Изначально, цель этого проекта – это организовать крупную базу, в которой будут храниться вся юридические дела. Теперь специальное программное обеспечение сможет выполнить комплексный анализ доступных документов, тем самым значительно упрощая работу юристам.

Компании смогут обучать "умные машины" с целью упрощения судебного процесса, так как (на основании полученной информации) ИИ сможет выдавать определённые решения.

Я думаю, многие компании и разработчики сейчас начнут экспериментировать с полученной базой, тем самым значительно ускоряя прогресс. На самом деле, довольно трудно выстроить комфортную систему, если нет возможности обеспечить доступ к нужной информации, - заявил автор проекта Адам Циглер.

Как уже не раз отмечалось, ключевым ограничением в обучении ИИ для использования в юридической сфере являлось отсутствие по-настоящему большого объёма данных, собранного в одном месте. Разработчики тратили массу времени и ресурсов на разработку собственных баз.

Основная статья: https://www.technologyreview.com/the-download/612361/harvard-just-put-more-than-6-million-court-cases-online-to-give-legal-ai-a-boost/