Данное исследование посвящено комплексному изучению зависимости размера файлов текстовых документов от применяемой кодировки символов. В рамках проекта будет проведен сравнительный анализ популярных кодировок, таких как UTF-8, UTF-16, Windows-1251 и ISO 8859-5, на основе подборки реальных текстовых файлов различного содержания и объема. Целью работы является выявление закономерностей и определение наиболее эффективных кодировок для минимизации объема хранимых данных без потери качества информации. Особое внимание будет уделено анализу влияния специфики контента (например, наличие кириллических, латинских, или специальных символов) на конечный размер файла. Результаты исследования позволят выработать практические рекомендации по оптимизации хранения текстовой информации, что актуально для разработчиков программного обеспечения, системных администраторов и пользователей, работающих с большими массивами текстовых данных.