Формат word ms


Общие сведения о формате двоичных файлов Word MS-DOC

Эта документация перемещена в архив и не поддерживается.

Обзор. Сведения о двоичном формате файлов MS-DOC, который используется в продуктах Microsoft Word прежних версий, включая базовые структуры и ключевые концепции для программного взаимодействия с ним.

Дата последнего изменения: 6 января 2012 г.

Применимо к: Office 2007 | Office 2010 | Open XML | Visual Studio Tools for Microsoft Office | Word | Word 2007 | Word 2010

В этой статье Общие сведения о двоичном формате файлов MS-DOC Заключение Дополнительные материалы

Дата публикации:   февраль 2011 года

Автор:   корпорация Майкрософт

Содержание

В этой статье описывается структура файлов MS-DOC и некоторые процедуры по работе с ними. Данная статья входит в серию статей, посвященных двоичным форматам файлов, используемым продуктами Microsoft Office. Эти статьи следует использовать совместно с документами Office File Format Documents, опубликованными на сайте MSDN.

В Microsoft Office Word 2003, Microsoft Word 2002, Microsoft Word 2000 и Microsoft Word 97 в качестве формата по умолчанию используется двоичный формат файлов MS-DOC. Этот формат имеют все файлы с расширением DOC или DOT. Базовой единицей измерения данных в документе Word является символ, к таким символам может относиться форматирование и другие невидимые символы, а также символы в кодировке ANSI и Юникод. Все данные о символах размещаются в потоке документа Word. В начале этого потока находится структура под названием блок файловой информации (File Information Block — FIB), которая содержит указатели на все данные в файле.

Примечание

Рекомендуемый способ выполнения большей части задач программирования в Microsoft Word заключается в использовании основных сборок взаимодействия Word. Это набор классов .NET, который предоставляет полную объектную модель для работы с Microsoft Word. В этой серии статей рассматриваются только расширенные сценарии, например такие, в которых продукт Microsoft Word не установлен.

Основные компоненты формата файлов MS-DOC

Ниже описаны наиболее важные структуры, о которых вам следует знать при работе с файлами DOC.

Извлечение текста из файлов Word

Формальный алгоритм для извлечения текста приведен в документах об открытых спецификациях на сайте MSDN в подразделе 2.4.1 Retrieving Text, кроме того, в подразделе 3.1 Example of a Clx раздела с примерами приведен пример реализации части данной процедуры. Здесь описана упрощенная версия всего процесса.

Порядок извлечения текста из документа Word

  1. Считайте файл DOC в поток данных.

  2. Начните считывание блока файловой информации со смещения 0 потока документа Word. Дополнительные сведения см. в разделе 2.5.15 How to read the FIB.

  3. Внутри блока файловой информации найдите структуру FibRgFcLcb97. Эта структура начинается с байта 54 блока файловой информации и состоит из последовательности 4-байтовых полей.

  4. Считайте поле FibRgFcLcb97.fcClx по байту 268 и поле FibRgFcLcb97.lcbClx по байту 272. Они указывают смещение расположения и размер структуры Clx.

  5. Начните считывать структуру Clx из потока таблицы со смещением, указанным в поле FibRgFcLcb97.fcClx.

  6. Внутри структуры Clx найдите структуру Pcdt, которая идет сразу за массивом .RgPrc, имеющим переменный размер и состоящим из структур Prc.

    Для каждого элемента этого массива выполните следующее:

    1. Считайте атрибут .clxt, который является байтом 0 структуры Prc. Если .clxt = 0x02, значит вы нашли Pcdt.

    2. Если .clxt = 0x01, считайте следующие два байта в качестве целого числа со знаком, а затем перейдите вперед на это число байт к следующему элементу массива.

  7. Внутри структуры Pcdt найдите структуру PlcPcd, которая начинается с пятого байта структуры Pcdt.

  8. Загрузите массив PlcPcd.aPcd и массив PlcPcd.aCp. Элементы этих массивов соотносятся друг с другом по значению индекса.

  9. Для каждой структуры Pcd в PlcPcd.aPcd выполните следующее:

    1. Считайте значение поля Pcd.Fc.fCompressed по биту 46 текущей структуры Pcd. Если получено значение 0, структура Pcd ссылается на 16-разрядный символ Юникода. Если получено значение 1, структура ссылается на 8-разрядный символ ANSI.

    2. Считайте значение Pcd.Fc, которое соответствует байтам 2–5 текущей структуры Pcd, и соответствующее значение позиции символа.

      • В случае с Юникодом текст в позиции символа, указанной текущим значением позиции, начинается со смещением, которое равно значению Pcd.Fc в потоке документа Word, и занимает два байта на символ.

      • В случае с ANSI текст в текущей позиции символа начинается со смещением, которое равно половине значения Pcd.Fc и занимает один байт на символ.

      В любом случае число символов, указанное текущей позицией символа, равно разности значений следующей позиции символа в массиве и текущей позиции символа.

В этой статье приведен лишь пример формата MS-DOC. Указанные в данной статье средства позволят вам с легкостью овладеть восстановлением данных. После изучения дополнительных материалов вы сможете приступить к восстановлению сведений о форматировании и других метаданных, а затем перейди к операциям сохранения.

Для получения дополнительных сведения см. следующие ресурсы:

msdn.microsoft.com

Двоичный формат файлов Microsoft Word 97—2007

Хотя MS-DOS и являлась текстовой операционной системой, лишённой графической оболочки, Word для DOS был первым текстовым процессором для IBM PC, который был способен отображать разметку текста, например, полужирный или курсивный текст в процессе редактирования. Однако он всё же не являлся в полном смысле WYSIWYG-редактором. Другие же текстовые процессоры, такие как WordStar и WordPerfect, использовали простой текстовый экран с кодами разметки, иногда текст был цветным.

Однако, поскольку в большинстве программного обеспечения под DOS применялись собственные труднозапоминаемые комбинации «горячих клавиш» для каждой команды (например, в Word’е для DOS сохранение файла выполнялось по комбинации ESC-T-S) и большинство секретарей умели пользоваться только WordPerfect, компании весьма неохотно переходили на конкурирующие с ним продукты, имеющие сравнительно небольшие преимущества.

1990—1995 годы

Первая версия Word для Windows, выпущенная в 1989 году, продавалась по цене 500 долларов США. Она демонстрировала выбранный компанией Майкрософт путь развития: как и сама Windows, она многое взяла от Macintosh, и использовала стандартные клавиатурные сокращения (например, CTRL-S для сохранения файла). После выпуска в следующем году Windows 3.0 продажи поползли вверх (Word 1.0 гораздо лучше работал с Windows 3.0, чем с более старыми версиями Windows/386 и Windows/286), главный конкурент — WordPerfect — не смог выпустить рабочую версию под Windows, что оказалось для него смертельной ошибкой. Версия 2.0 утвердила WinWord на позиции лидера рынка.

У Word для Macintosh никогда не было серьёзных конкурентов, даже несмотря на наличие программ вроде Nisus, предоставлявшую возможность выделения нескольких несвязных кусков текста (появившуюся только в Word 2002 из Office XP) и несмотря на мнение многих пользователей об отсутствии кардинальных различий между версиями 3.01, выпущенной в 1987 году и версией 5.0, выпущенной в 1991. Однако, версия 6.0 для Macintosh, вышедшая в 1994 году, была многими воспринята довольно скептически. Это была первая версия без значительных отличий в коде ядра между версиями под Windows и под Mac. Версия под Windows, следовавшая за 2.0, была пронумерована как 6.0 для координации названия версий под разные платформы.

Последовавшие версии добавляли возможности, выходящие за рамки простого текстового процессора. Инструменты рисования позволяли выполнять примитивные операции вёрстки, такие как добавление графики в документ, хотя, естественно, специализированные программы для вёрстки лучше справляются с этими задачами. Внедрение объектов, сравнение версий документа, мультиязычная поддержка и многие другие возможности были добавлены за последовавшие несколько лет.

Настоящее время

Microsoft Word является наиболее популярным из используемых в данный момент текстовых процессоров, что сделало его бинарный формат документа стандартом де-факто, и многие конкурирующие программы имеют поддержку совместимости с данным форматом. Расширение «.doc» на платформе IBM PC стало синонимом двоичного формата Word 97—2000. Фильтры экспорта и импорта в данный формат присутствуют в большинстве текстовых процессоров.Формат документа разных версий Word меняется, различия бывают довольно тонкими. Форматирование, нормально выглядящее в последней версии, может не отображаться в старых версиях программы, однако есть ограниченная возможность сохранения документа с потерей части форматирования для открытия в старых версиях продукта. Последняя версия MS Word 2007 "использует по умолчанию" формат основанный на Microsoft Office Open XML. Спецификация форматов файлов Word 97-2007 были опубликован Microsoft в 2008 году.[1][2] Ранее, большая часть информации, нужной для работы с данным форматом, добывалась посредством обратного инжиниринга, поскольку основная её часть отсутствовала в открытом доступе или была доступна лишь ограниченному числу партнеров и контролирующих организаций.

Как и прочие приложения из Microsoft Office, Word может расширять свои возможности посредством использования встроенного макроязыка (сначала использовался WordBasic, с версии Word 97 применяется VBA — Visual Basic для приложений). Однако это предоставляет широкие возможности для написания встраиваемых в документы вирусов (так называемые «макровирусы»). Наиболее ярким примером была эпидемия червя Melissa. В связи с этим, многие считают разумной рекомендацию всегда выставлять наивысший уровень настроек безопасности при использовании Word (Меню: «Tools>Macro>Security», «Сервис>Макрос>Безопасность…» в локализованных русских версиях). Также нелишним будет использовать антивирусное программное обеспечение. Первым вирусом, заражавшим документы Microsoft Word, был DMV, созданный в декабре 1994 года Дж. МакНамарой для демонстрации возможности создания макровирусов. Первым же вирусом, попавшим в "дикую природу" и вызвавшим первую в мире эпидемию макровирусов (это произошло в июле-августе 1995 г.), был Concept.

История версий

Версии для 1983, ноябрь Word 1

  • 1985 Word 2
  • 1986 Word 3
  • 1987 Word 4, также известный как Microsoft Word 4.0 для PC
  • 1989 Word 5
  • 1991 Word 5.5
  • Версии для Apple Macintosh:

    Версии для Microsoft Windows:

    Версии для SCO UNIX:

    Недокументированные возможности и курьёзы

    Следующие функции вводятся в любом месте документа с начала строки. Замена их на определённый текст осуществляется при нажатии клавиши Enter.

    Функция rand()

    =rand(x,y)

    В редакторе версии младше 2007 строка с командой будет заменена матрицей из панграмм:

    Съешь ещё этих мягких французских булок, да выпей чаю.

    Параметр x задаёт количество столбцов матрицы, y — количество строк. Параметры можно не указывать.

    В редакторе Word 2007 строка с данной функцией будет заменена на отрывок из текста справки, параметр x задаёт количество абзацев, y — количество предложений в каждом абзаце.

    Функция lorem()

    =lorem()

    В редакторе Word 2007 строка с данной функцией будет заменена на отрывок из текста Lorem ipsum.

    Курьёзные ошибки в модуле проверки русской орфографии

    Примечания

    Ссылки

    Литература

    dic.academic.ru

    word - Википедия

    Microsoft Word Тип Разработчик Операционная система Последняя версия Читаемые форматы файлов Создаваемые форматы файлов Лицензия Сайт

    Текстовый процессор

    Microsoft

    Microsoft Windows

    2016 (2015)

    DOC, DOCX[d], Rich Text Format, Текстовые данные, [d][1], [d], [d][1] и [d][1]

    DOC, DOCX[d], [d][1], Rich Text Format, Текстовые данные, [d], [d][1] и [d][1]

    Проприетарное программное обеспечение

    office.microsoft.com/ru-ru/word

     Microsoft Word на Викискладе
    Microsoft Word (macOS) Тип Разработчик Операционная система Последняя версия Читаемые форматы файлов Создаваемые форматы файлов Лицензия Сайт

    Текстовый процессор

    Microsoft

    macOS

    2016 (2015)

    DOC, DOCX[d], Rich Text Format, Текстовые данные, [d][1], [d], [d][1] и [d][1]

    DOC, DOCX[d], [d][1], Rich Text Format, Текстовые данные, [d], [d][1] и [d][1]

    Проприетарное программное обеспечение

    microsoft.com/rus/mac/word

     [[commons:Category:Microsoft Word|Microsoft Word (macOS) на Викискладе]]

    Microsoft Word (часто — MS Word, WinWord или просто Word) — текстовый процессор, предназначенный для создания, просмотра и редактирования текстовых документов, с локальным применением простейших форм таблично-матричных алгоритмов. Выпускается корпорацией Microsoft в составе пакета Microsoft Office. Первая версия была написана (Richard Brodie) для IBM PC, использующих DOS, в 1983 году. Позднее выпускались версии для Apple Macintosh (1984), SCO UNIX и Microsoft Windows (1989). Текущей версией является Microsoft Office Word 2016 для Windows и macOS.

    Начало[ | ]

    Microsoft Word многим обязан  — текстовому процессору с оригинальным графическим интерфейсом, разработанному в исследовательском центре «Xerox PARC». Создатель Bravo Чарльз Симони (Charles Simonyi) покинул PARC в 1981 году. Тем же летом Симони переманил Броди, с которым вместе работал над Bravo.

    Первый выпуск Word для MS-DOS состоялся в конце 1983 года. Он был плохо принят рынком, продажи снижало наличие конкурирующего продукта — WordPerfect.

    Однако версия для «макинтоша», выпущенная в 1985 году, получила широкое распространение. Через два года «Word 3.01 для Macintosh» усилил позиции (версия 3.0 изобиловала ошибками и быстро была заменена). Как и прочее программное обеспечение для «макинтоша», Word был полностью WYSIWYG-редактором (принцип «What You See Is What You Get» — «получаю то, что вижу»).

    Хотя MS-DOS и являлась текстовой операционной системой, лишённой графической оболочки, Word для DOS был первым текстовым процессором для IBM PC, который был способен отображать разметку текста, например, полужирный или курсивный текст в процессе редактирования. Однако он всё же не являлся в полном смысле WYSIWYG-редактором. Другие же текстовые процессоры, такие как и WordPerfect, использовали простой текстовый экран с кодами разметки, иногда текст был цветным.

    Однако, поскольку в большинстве программного обеспечения под DOS применялись собственные труднозапоминаемые комбинации «горячих клавиш» для каждой команды (например, в Word’е для DOS сохранение файла выполнялось по комбинации ESC-T-S) и большинство секретарей умели пользоваться только WordPerfect, компании-пользователи WordPerfect весьма неохотно переходили на конкурирующие с ним продукты, имеющие сравнительно небольшие преимущества.

    1990—1995 годы[ | ]

    Первая версия Word для Windows, выпущенная в 1989 году, продавалась по цене $500. Она демонстрировала выбранный компанией «Майкрософт» путь развития: как и сама Windows, она многое взяла от Macintosh и использовала стандартные клавиатурные сокращения (например, Ctrl+S для сохранения файла). После выпуска в следующем году Windows 3.0 продажи поползли вверх (Word 1.0 гораздо лучше работал с Windows 3.0, чем с более старыми версиями Windows x386 и Windows x286), главный конкурент — WordPerfect — не смог выпустить рабочую версию под Windows, что оказалось для него смертельной ошибкой. Версия 2.0 утвердила WinWord на позиции лидера рынка.

    Последовавшие версии добавляли возможности, выходящие за рамки простого текстового процессора. Инструменты рисования позволяли выполнять примитивные операции вёрстки, такие, как добавление графики в документ, хотя, естественно, специализированные программы для вёрстки лучше справляются с этими задачами. Внедрение объектов, сравнение версий документа, мультиязычная поддержка и многие другие возможности были добавлены за последовавшие несколько лет.

    Настоящее время[ | ]

    Microsoft Word является наиболее популярным из используемых в данный момент текстовых процессоров, что сделало его бинарный формат документа стандартом де-факто, и многие конкурирующие программы имеют поддержку совместимости с данным форматом. Расширение «.doc» на платформе IBM PC стало синонимом двоичного формата Word 97—2000. Фильтры экспорта и импорта в данный формат присутствуют в большинстве текстовых процессоров. Формат документа разных версий Word меняется, различия бывают довольно тонкими. Форматирование, нормально выглядящее в последней версии, может не отображаться в старых версиях программы, однако есть ограниченная возможность сохранения документа с потерей части форматирования для открытия в старых версиях продукта. Последняя версия MS Word 2007 «использует по умолчанию» формат, основанный на XML, — Microsoft Office Open XML. Спецификации форматов файлов Word 97-2007 были опубликованы Microsoft в 2008 году[2][3]. Ранее большая часть информации, нужной для работы с данным форматом, добывалась посредством обратного инжиниринга, поскольку основная её часть отсутствовала в открытом доступе или была доступна лишь ограниченному числу партнёров и контролирующих организаций.

    Как и прочие приложения из Microsoft Office, Word может расширять свои возможности посредством использования встроенного макроязыка (сначала использовался , с версии Word 97 применяется VBA — Visual Basic для приложений). Однако это предоставляет широкие возможности для написания встраиваемых в документы вирусов (так называемые «макровирусы»). Наиболее ярким примером была эпидемия червя Melissa. В связи с этим многие считают разумной рекомендацию всегда выставлять наивысший уровень настроек безопасности при использовании Word (Меню: «Tools>Macro>Security», «Сервис>Макрос>Безопасность…» в локализованных русских версиях). Также нелишним будет использовать антивирусное программное обеспечение. Первым вирусом, заражавшим документы Microsoft Word, был DMV, созданный в декабре 1994 года Дж. Мак-Намарой для демонстрации возможности создания макровирусов. Первым же вирусом, попавшим в «дикую природу» и вызвавшим первую в мире эпидемию макровирусов (это произошло в июле-августе 1995 года), был Concept.

    12 августа 2009 года суд штата Техас запретил продажу программы Word на территории США, в связи с тем, что Microsoft незаконно использует метод чтения XML-файлов, патент на который принадлежит канадской компании i4i.

    История версий[ | ]

    Версии для MS-DOS:

    Версии для Apple OS X:

    Версии для Apple iOS:

    Версии для Microsoft Windows:

    Версии для SCO UNIX:

    Парольная защита документов MS Word[ | ]

    На документ Microsoft Word могут быть установлены 3 типа паролей:

    Вне зависимости от версий MS Word, в которой был создан документ, «пароль разрешения записи» и «пароль на внесение примечаний и исправлений» можно удалить из документа мгновенно[7]. Эти типы паролей служат не столь для защиты документа, как для обеспечения коллективной работы над документом. А основную защиту документа от несанкционированного доступа обеспечивает «пароль для открытия документа».

    В документах ранних версиях MS Word (до MS Office 2003 включительно) пароль для открытия файла может быть без проблем взломан.

    В последних версия MS Office 2007 \ 2010 компания Microsoft использует стойкий алгоритм шифрования AES с 128-битным ключом. Формирование ключа происходит путём 50000 \ 100000 кратного применения SHA-1 хэш функции, что делает перебор паролей крайне медленным, и при использовании стойкого пароля шансы его подобрать близки к нулю[8].

    Критика[ | ]

    Чаще всего Microsoft Word подвергается критике за низкую безопасность, закрытый исходный код, отсутствие полноценной кроссплатформенности[9]. Ранее Word критиковали также за закрытый формат файлов (открытая документация на бинарные форматы появилась только в начале 2008 года). Это побудило отдельные организации перейти к использованию других текстовых процессоров, таких как OpenOffice Writer, входящего в офисный пакет OpenOffice.org. Инструментов Microsoft Word недостаточно для создания качественного полиграфического продукта[10].

    Недокументированные возможности и курьёзы[ | ]

    Следующие функции вводятся в любом месте документа с начала строки. Замена их на определённый текст осуществляется при нажатии клавиши Enter.

    Функция rand()[ | ]

    =rand(x,y)

    В редакторе версии младше 2007 строка с командой будет заменена матрицей из панграмм:

    Съешь ещё этих мягких французских булок, да выпей чаю.

    Параметр x задаёт количество столбцов матрицы, y — количество строк. Параметры можно не указывать.

    В редакторе Word 2007 строка с данной функцией будет заменена на отрывок из текста справки, параметр x задаёт количество абзацев, y — количество предложений в каждом абзаце. Функция =rand.old(x, y) работает как =rand(x, y) в более ранних версиях редактора.

    Функция lorem()[ | ]

    =lorem()

    В редакторах Word 2007 и 2010 строка с данной функцией будет заменена на отрывок из текста Lorem ipsum.

    Курьёзные ошибки в модуле проверки русской орфографии версии 2003 года[ | ]

    Модуль проверки русской орфографии, поставляемый с русифицированными версиями Microsoft Word за исключением MS Word 2013, является упрощенной версией системы Орфо, производимой российской компанией ООО «Информатик».

    Почти все недоработки были исправлены в Microsoft Word 2003 SP3 и последующих версиях продукта.

    См. также[ | ]

    Примечания[ | ]

    Литература[ | ]

    Ссылки[ | ]

    encyclopaedia.bid

    word вики

    Microsoft Word Тип Разработчик Операционная система Последняя версия Читаемые форматы файлов Создаваемые форматы файлов Лицензия Сайт

    Текстовый процессор

    Microsoft

    Microsoft Windows

    2016 (2015)

    DOC, DOCX[d], Rich Text Format, Текстовые данные, Office Open XML Wordprocessing Document, Strict, ISO/IEC 29500:2008, with Microsoft extensions[d][1], Microsoft Office XML formats[d], OpenDocument Text, version 1.1[d][1] и OpenDocument Text, version 1.2[d][1]

    DOC, DOCX[d], Office Open XML Wordprocessing Document, Strict, ISO/IEC 29500:2008, with Microsoft extensions[d][1], Rich Text Format, Текстовые данные, Microsoft Office XML formats[d], OpenDocument Text, version 1.1[d][1] и OpenDocument Text, version 1.2[d][1]

    Проприетарное программное обеспечение

    office.microsoft.com/ru-ru/word

     Microsoft Word на Викискладе
    Microsoft Word (macOS) Тип Разработчик Операционная система Последняя версия Читаемые форматы файлов Создаваемые форматы файлов Лицензия Сайт

    Текстовый процессор

    Microsoft

    macOS

    2016 (2015)

    DOC, DOCX[d], Rich Text Format, Текстовые данные, Office Open XML Wordprocessing Document, Strict, ISO/IEC 29500:2008, with Microsoft extensions[d][1], Microsoft Office XML formats[d], OpenDocument Text, version 1.1[d][1] и OpenDocument Text, version 1.2[d][1]

    DOC, DOCX[d], Office Open XML Wordprocessing Document, Strict, ISO/IEC 29500:2008, with Microsoft extensions[d][1], Rich Text Format, Текстовые данные, Microsoft Office XML formats[d], OpenDocument Text, version 1.1[d][1] и OpenDocument Text, version 1.2[d][1]

    Проприетарное программное обеспечение

    microsoft.com/rus/mac/word

     [[commons:Category:Microsoft Word|Microsoft Word (macOS) на Викискладе]]

    Microsoft Word (часто — MS Word, WinWord или просто Word) — текстовый процессор, предназначенный для создания, просмотра и редактирования текстовых документов, с локальным применением простейших форм таблично-матричных алгоритмов. Выпускается корпорацией Microsoft в составе пакета Microsoft Office. Первая версия была написана Ричардом Броди (Richard Brodie) для IBM PC, использующих DOS, в 1983 году. Позднее выпускались версии для Apple Macintosh (1984), SCO UNIX и Microsoft Windows (1989). Текущей версией является Microsoft Office Word 2016 для Windows и macOS.

    Начало[ | ]

    Microsoft Word многим обязан Bravo — текстовому процессору с оригинальным графическим интерфейсом, разработанному в исследовательском центре «Xerox PARC». Создатель Bravo Чарльз Симони (Charles Simonyi) покинул PARC в 1981 году. Тем же летом Симони переманил Броди, с которым вместе работал над Bravo.

    Первый выпуск Word для MS-DOS состоялся в конце 1983 года. Он был плохо принят рынком, продажи снижало наличие конкурирующего продукта — WordPerfect.

    Однако версия для «макинтоша», выпущенная в 1985 году, получила широкое распространение. Через два года «Word 3.01 для Macintosh» усилил позиции (версия 3.0 изобиловала ошибками и быстро была заменена). Как и прочее программное обеспечение для «макинтоша», Word был полностью WYSIWYG-редактором (принцип «What You See Is What You Get» — «получаю то, что вижу»).

    Хотя MS-DOS и являлась текстовой операционной системой, лишённой графической оболочки, Word для DOS был первым текстовым процессором для IBM PC, который был способен отображать разметку текста, например, полужирный или курсивный текст в процессе редактирования. Однако он всё же не являлся в полном смысле WYSIWYG-редактором. Другие же текстовые процессоры, такие как WordStar и WordPerfect, использовали простой текстовый экран с кодами разметки, иногда текст был цветным.

    Однако, поскольку в большинстве программного обеспечения под DOS применялись собственные труднозапоминаемые комбинации «горячих клавиш» для каждой команды (например, в Word’е для DOS сохранение файла выполнялось по комбинации ESC-T-S) и большинство секретарей умели пользоваться только WordPerfect, компании-пользователи WordPerfect весьма неохотно переходили на конкурирующие с ним продукты, имеющие сравнительно небольшие преимущества.

    1990—1995 годы[ | ]

    Первая версия Word для Windows, выпущенная в 1989 году, продавалась по цене $500. Она демонстрировала выбранный компанией «Майкрософт» путь развития: как и сама Windows, она многое взяла от Macintosh и использовала стандартные клавиатурные сокращения (например, Ctrl+S для сохранения файла). После выпуска в следующем году Windows 3.0 продажи поползли вверх (Word 1.0 гораздо лучше работал с Windows 3.0, чем с более старыми версиями Windows x386 и Windows x286), главный конкурент — WordPerfect — не смог выпустить рабочую версию под Windows, что оказалось для него смертельной ошибкой. Версия 2.0 утвердила WinWord на позиции лидера рынка.

    Последовавшие версии добавляли возможности, выходящие за рамки простого текстового процессора. Инструменты рисования позволяли выполнять примитивные операции вёрстки, такие, как добавление графики в документ, хотя, естественно, специализированные программы для вёрстки лучше справляются с этими задачами. Внедрение объектов, сравнение версий документа, мультиязычная поддержка и многие другие возможности были добавлены за последовавшие несколько лет.

    Настоящее время[ | ]

    Microsoft Word является наиболее популярным из используемых в данный момент текстовых процессоров, что сделало его бинарный формат документа стандартом де-факто, и многие конкурирующие программы имеют поддержку совместимости с данным форматом. Расширение «.doc» на платформе IBM PC стало синонимом двоичного формата Word 97—2000. Фильтры экспорта и импорта в данный формат присутствуют в большинстве текстовых процессоров. Формат документа разных версий Word меняется, различия бывают довольно тонкими. Форматирование, нормально выглядящее в последней версии, может не отображаться в старых версиях программы, однако есть ограниченная возможность сохранения документа с потерей части форматирования для открытия в старых версиях продукта. Последняя версия MS Word 2007 «использует по умолчанию» формат, основанный на XML, — Microsoft Office Open XML. Спецификации форматов файлов Word 97-2007 были опубликованы Microsoft в 2008 году[2][3]. Ранее большая часть информации, нужной для работы с данным форматом, добывалась посредством обратного инжиниринга, поскольку основная её часть отсутствовала в открытом доступе или была доступна лишь ограниченному числу партнёров и контролирующих организаций.

    Как и прочие приложения из Microsoft Office, Word может расширять свои возможности посредством использования встроенного макроязыка (сначала использовался WordBasic, с версии Word 97 применяется VBA — Visual Basic для приложений). Однако это предоставляет широкие возможности для написания встраиваемых в документы вирусов (так называемые «макровирусы»). Наиболее ярким примером была эпидемия червя Melissa. В связи с этим многие считают разумной рекомендацию всегда выставлять наивысший уровень настроек безопасности при использовании Word (Меню: «Tools>Macro>Security», «Сервис>Макрос>Безопасность…» в локализованных русских версиях). Также нелишним будет использовать антивирусное программное обеспечение. Первым вирусом, заражавшим документы Microsoft Word, был DMV, созданный в декабре 1994 года Дж. Мак-Намарой для демонстрации возможности создания макровирусов. Первым же вирусом, попавшим в «дикую природу» и вызвавшим первую в мире эпидемию макровирусов (это произошло в июле-августе 1995 года), был Concept.

    12 августа 2009 года суд штата Техас запретил продажу программы Word на территории США, в связи с тем, что Microsoft незаконно использует метод чтения XML-файлов, патент на который принадлежит канадской компании i4i.

    История версий[ | ]

    Версии для MS-DOS:

    Версии для Apple OS X:

    Версии для Apple iOS:

    Версии для Microsoft Windows:

    Версии для SCO UNIX:

    Парольная защита документов MS Word[ | ]

    На документ Microsoft Word могут быть установлены 3 типа паролей:

    Вне зависимости от версий MS Word, в которой был создан документ, «пароль разрешения записи» и «пароль на внесение примечаний и исправлений» можно удалить из документа мгновенно[7]. Эти типы паролей служат не столь для защиты документа, как для обеспечения коллективной работы над документом. А основную защиту документа от несанкционированного доступа обеспечивает «пароль для открытия документа».

    В документах ранних версиях MS Word (до MS Office 2003 включительно) пароль для открытия файла может быть без проблем взломан.

    В последних версия MS Office 2007 \ 2010 компания Microsoft использует стойкий алгоритм шифрования AES с 128-битным ключом. Формирование ключа происходит путём 50000 \ 100000 кратного применения SHA-1 хэш функции, что делает перебор паролей крайне медленным, и при использовании стойкого пароля шансы его подобрать близки к нулю[8].

    Критика[ | ]

    Чаще всего Microsoft Word подвергается критике за низкую безопасность, закрытый исходный код, отсутствие полноценной кроссплатформенности[9]. Ранее Word критиковали также за закрытый формат файлов (открытая документация на бинарные форматы появилась только в начале 2008 года). Это побудило отдельные организации перейти к использованию других текстовых процессоров, таких как OpenOffice Writer, входящего в офисный пакет OpenOffice.org. Инструментов Microsoft Word недостаточно для создания качественного полиграфического продукта[10].

    Недокументированные возможности и курьёзы[ | ]

    Следующие функции вводятся в любом месте документа с начала строки. Замена их на определённый текст осуществляется при нажатии клавиши Enter.

    Функция rand()[ | ]

    =rand(x,y)

    В редакторе версии младше 2007 строка с командой будет заменена матрицей из панграмм:

    Съешь ещё этих мягких французских булок, да выпей чаю.

    Параметр x задаёт количество столбцов матрицы, y — количество строк. Параметры можно не указывать.

    В редакторе Word 2007 строка с данной функцией будет заменена на отрывок из текста справки, параметр x задаёт количество абзацев, y — количество предложений в каждом абзаце. Функция =rand.old(x, y) работает как =rand(x, y) в более ранних версиях редактора.

    Функция lorem()[ | ]

    =lorem()

    В редакторах Word 2007 и 2010 строка с данной функцией будет заменена на отрывок из текста Lorem ipsum.

    Курьёзные ошибки в модуле проверки русской орфографии версии 2003 года[ | ]

    Модуль проверки русской орфографии, поставляемый с русифицированными версиями Microsoft Word за исключением MS Word 2013, является упрощенной версией системы Орфо, производимой российской компанией ООО «Информатик».

    Почти все недоработки были исправлены в Microsoft Word 2003 SP3 и последующих версиях продукта.

    См. также[ | ]

    Примечания[ | ]

    Литература[ | ]

    Ссылки[ | ]

    www.ruwikiorg.ru


    Смотрите также