Viktor N. писал(а):Ирuc2аuc2зуuc2жсuc2еuc2гuc2оuc2дuc2нuc2янuc2аuc2мдuc2еuc2йuc2сuc2тuc2вuc2иuc2тuc2еuc2лuc2ьuc2нuc2онuc2евuc2еuc2зuc2ёuc2т
Рискну предположить, что на одной странице у вас одна кодировка, на другой - другая. Соответственно, проблема в том, что программа попыталась прочитать раздел с другой кодировкой используя ту кодировку, которая была на первой странице. С DOC вообще могут быть фокусы. Например, некоторые программы любят генерировать RTF, а обзывать его DOC, потому что Word все равно это откроет. Однако, стандартная кодировка у RTF другая ("A standard RTF file can consist of only 7-bit ASCII characters, but can encode characters beyond ASCII by escape sequences"), в результате имеем шанс получить вопросы, квадраты или мешанину из кодировок.
Однако, что бы это значило и как с этим бороться?
Не смешивать форматы. Лучше берите docx - там хотя бы кодировка изначально нормальная. И с осторожностью используйте форматы/программы, которые используют кодировки, отличные от UTF-8/16.