May 25, 2022

Поиск повторяющихся строк в Notepad++

Задача: найти повторяющиеся строки в большом текстовом файле.

Варианта четыре - заюзать Excel, установить плагин для Notepad++, воспользоваться регулярными выражениями или написать скрипт, который сможет это сделать.

Написание скрипта пока отложу.

Excel - долго и нудно. Большой объем данных.

С плагином TextFX не срослось в 64-битной версии операционной системы он не работает. Даже при запуске и установке от имени администратора (хотя при чем тут это).

В Интернетах нашел регулярное выражение: ^(.*?)$\s+?^(?=.*^\1$)

Не буду разбирать, что именно оно значит, главное - работает. Но для начала нужно отсортировать строки.