Отличный вопрос! Вот краткий и понятный ответ, почему нейросети (в том числе ChatGPT, GPT-4 и другие LLM) не могут или не должны парсить email-адреса автоматически:

 

  1. Ограничения конфиденциальности и политики безопасности

Email-адреса считаются персональными данными, и встраивание автоматического извлечения их из текста нарушает политики GDPR, CCPA и других законов о защите данных.

 

Модели OpenAI (и других компаний) обучены не реагировать на просьбы извлечь, распознать или парсить e-mail — это встроено в фильтры и архитектуру.

 

Даже если email-адрес в открытом тексте — нейросеть притворяется, что не видит его или искажает.

 

  1. Модель обучена “быть вежливой” — а не технической

GPT-модель — это не просто синтаксический парсер. Её цель — генерировать язык, а не вытаскивать данные.

 

Нейросети умеют обрабатывать текст, но не фокусируются на техническом извлечении шаблонов, как regex, парсеры или скрипты.