Основной особенностью программы Авто-рерайт является ее словарь. Во-первых, он отобран вручную, хотя иногда слова смотрятся неуместно. Во-вторых, основой словаря стал частотный словарь русского языка. К примеру слово “и” встречается более 30 000 раз в 1 000 000 слов, а например “синхрофазатрон” менее одного раза. Нами были отобраны наиболее часто встречающиеся слова и подходящие к ним синонимы. Поэтому при тестировании базы в 800 слов заменялось около 20% слов. Словарь синонимов Абрамова (18 000 слов) на этом же тексте показал всего 15% замен.
Сейчас база значительно расширена (около 6 500 слов) и будет постоянно пополняться. Также важным моментом является учет морфологии слов (например, самый, самая, самое, самые и т.д.).