March 2

Регулярные выражения для Notepad++: 15 полезных примеров на все случаи жизни

Notepad++ — это мощный текстовый редактор, который я использую для работы с кодом, текстами и данными. Он легкий, быстрый и поддерживает множество функций, которые делают обработку текста удобной и эффективной. Одна из самых полезных возможностей Notepad++ — это работа с регулярными выражениями (regex). Регулярные выражения позволяют находить, заменять и удалять текст по сложным шаблонам, что экономит время и упрощает рутинные задачи.

В этой статье я собрал 15 регулярных выражений, которые помогают мне в повседневной работе. Они пригодятся для очистки текста, поиска данных, удаления лишних символов и многого другого. Если вы раньше не работали с регулярными выражениями, не переживайте — я постарался объяснить каждое из них максимально просто. Давайте начнем!

Открываем текстовый документ с помощью Notepad++, нажимаем горячие клавиши Ctrl+H Выбираем Регулярные выражения, Зациклить поиск

Вот несколько полезных регулярных выражений, которые могут пригодиться в Notepad++ с пояснениями:


1. Удаление пустых строк

  • Регулярное выражение: ^\s*$
  • Пояснение: Ищет строки, которые состоят только из пробелов (\s*) или полностью пустые (^ — начало строки, $ — конец строки).
  • Как использовать: Оставьте поле "Заменить на" пустым, чтобы удалить пустые строки.

2. Удаление лишних пробелов в начале и конце строки

  • Регулярное выражение: ^\s+|\s+$
  • Пояснение: Ищет пробелы в начале строки (^\s+) или в конце строки (\s+$).
  • Как использовать: Оставьте поле "Заменить на" пустым, чтобы удалить лишние пробелы.

3. Удаление дубликатов строк

  • Регулярное выражение: ^(.*)(\r?\n\1)+$
  • Пояснение: Ищет повторяющиеся строки. \1 ссылается на первую захваченную группу (.*), а \r?\n учитывает перенос строки.
  • Как использовать: Замените на \1, чтобы оставить только одну уникальную строку.

4. Поиск и замена email-адресов

  • Регулярное выражение: [a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}
  • Пояснение: Ищет email-адреса. [a-zA-Z0-9._%+-]+ — имя пользователя, @ — символ "@", [a-zA-Z0-9.-]+ — домен, \.[a-zA-Z]{2,} — доменная зона.
  • Как использовать: Замените на нужный текст или удалите.

5. Поиск и замена телефонных номеров (например, в формате +7XXXYYYZZZZ)

  • Регулярное выражение: \+7\d{10}
  • Пояснение: Ищет номера телефонов, начинающиеся с +7 и содержащие 10 цифр после.
  • Как использовать: Замените на нужный текст или удалите.

6. Удаление HTML-тегов

  • Регулярное выражение: <[^>]+>
  • Пояснение: Ищет любые HTML-теги, начинающиеся с < и заканчивающиеся >. [^>]+ означает "любой символ, кроме >".
  • Как использовать: Оставьте поле "Заменить на" пустым, чтобы удалить все HTML-теги.

7. Поиск URL-адресов

  • Регулярное выражение: https?://[^\s]+
  • Пояснение: Ищет URL-адреса, начинающиеся с http:// или https://. [^\s]+ означает "любой символ, кроме пробела".
  • Как использовать: Замените на нужный текст или удалите.

8. Удаление текста в скобках (включая скобки)

  • Регулярное выражение: \([^()]*\)
  • Пояснение: Ищет текст в круглых скобках. \( и \) экранируют скобки, а [^()]* означает "любой символ, кроме скобок".
  • Как использовать: Оставьте поле "Заменить на" пустым, чтобы удалить текст вместе со скобками.

9. Поиск чисел в тексте

  • Регулярное выражение: \b\d+\b
  • Пояснение: Ищет целые числа. \b обозначает границу слова, \d+ — одну или более цифр.
  • Как использовать: Замените на нужный текст или удалите.

10. Удаление лишних переносов строк (оставить только один перенос)

  • Регулярное выражение: \r?\n\r?\n+
  • Пояснение: Ищет два или более переноса строки подряд. \r?\n учитывает как Windows (\r\n), так и Unix (\n) переносы.
  • Как использовать: Замените на \r\n (для Windows) или \n (для Unix), чтобы оставить только один перенос.

11. Поиск дат в формате DD.MM.YYYY

  • Регулярное выражение: \b\d{2}\.\d{2}\.\d{4}\b
  • Пояснение: Ищет даты в формате "день.месяц.год". \d{2} — две цифры, \. — точка, \d{4} — четыре цифры.
  • Как использовать: Замените на нужный текст или удалите.

12. Поиск и замена текста в кавычках

  • Регулярное выражение: "[^"]*"
  • Пояснение: Ищет текст в двойных кавычках. [^"]* означает "любой символ, кроме двойной кавычки".
  • Как использовать: Замените на нужный текст или удалите.

13. Удаление комментариев в коде (например, // или / ... /)

  • Для однострочных комментариев (//):
    • Регулярное выражение: //.*$
    • Пояснение: Ищет // и всё, что после него до конца строки.
  • Для многострочных комментариев (/* ... */):
    • Регулярное выражение: /\*.*?\*/
    • Пояснение: Ищет /*, затем любой текст (включая переносы строк), и заканчивается на */. .*? — нежадный поиск.
  • Как использовать: Оставьте поле "Заменить на" пустым, чтобы удалить комментарии.

14. Поиск слов с заглавной буквы

  • Регулярное выражение: \b[A-Z][a-z]*\b
  • Пояснение: Ищет слова, начинающиеся с заглавной буквы. [A-Z] — заглавная буква, [a-z]* — любое количество строчных букв.
  • Как использовать: Замените на нужный текст или удалите.

15. Удаление лишних запятых или точек с запятой

  • Регулярное выражение: [,;]+
  • Пояснение: Ищет одну или более запятых или точек с запятой.
  • Как использовать: Замените на одну запятую или точку с запятой, если нужно.

Эти регулярные выражения помогут вам эффективно работать с текстом в Notepad++

Больше полезного у меня на канале: 🚀 N8N | АВТОМАТИЗАЦИЯ | РАССЫЛКИ | ЧАТ-БОТЫ | AI