Формат word ms


Общие сведения о формате двоичных файлов Word MS-DOC

Эта документация перемещена в архив и не поддерживается.

Обзор. Сведения о двоичном формате файлов MS-DOC, который используется в продуктах Microsoft Word прежних версий, включая базовые структуры и ключевые концепции для программного взаимодействия с ним.

Дата последнего изменения: 6 января 2012 г.

Применимо к: Office 2007 | Office 2010 | Open XML | Visual Studio Tools for Microsoft Office | Word | Word 2007 | Word 2010

В этой статье Общие сведения о двоичном формате файлов MS-DOC Заключение Дополнительные материалы

Дата публикации:   февраль 2011 года

Автор:   корпорация Майкрософт

Содержание

В этой статье описывается структура файлов MS-DOC и некоторые процедуры по работе с ними. Данная статья входит в серию статей, посвященных двоичным форматам файлов, используемым продуктами Microsoft Office. Эти статьи следует использовать совместно с документами Office File Format Documents, опубликованными на сайте MSDN.

В Microsoft Office Word 2003, Microsoft Word 2002, Microsoft Word 2000 и Microsoft Word 97 в качестве формата по умолчанию используется двоичный формат файлов MS-DOC. Этот формат имеют все файлы с расширением DOC или DOT. Базовой единицей измерения данных в документе Word является символ, к таким символам может относиться форматирование и другие невидимые символы, а также символы в кодировке ANSI и Юникод. Все данные о символах размещаются в потоке документа Word. В начале этого потока находится структура под названием блок файловой информации (File Information Block — FIB), которая содержит указатели на все данные в файле.

Примечание

Рекомендуемый способ выполнения большей части задач программирования в Microsoft Word заключается в использовании основных сборок взаимодействия Word. Это набор классов .NET, который предоставляет полную объектную модель для работы с Microsoft Word. В этой серии статей рассматриваются только расширенные сценарии, например такие, в которых продукт Microsoft Word не установлен.

Основные компоненты формата файлов MS-DOC

Ниже описаны наиболее важные структуры, о которых вам следует знать при работе с файлами DOC.

  • 2.1.1 WordDocument Stream

    Поток документа Word — это основной поток в файле DOC, содержащий все данные файла, кроме таблиц, которые хранятся в 1Table stream or 0Table stream.

    • File Information Block

      Блок файловой информации начинается со смещением 0x00 по отношению к потоку документа Word. Он указывает расположение всех остальных данных в файле. Эти расположения указываются посредством пары целых чисел, первое из которых указывает расположение, а второе — размер. Эти числа указываются в подструктурах блока файловой информации, таких как FibRgFcLcb97. Имена расположений снабжаются префиксом fc, а названия размеров — префиксом lcb.

    • Структура Clx

      Структура Clx представляет собой массив из 0 или большего числа структур Prc, которые содержат сведения о свойствах, после чего идет структура Pcdt, содержащая структуру PlcPcd.

  • Character

    Символ может быть текстовым или нетекстовым, например знаком абзаца или привязкой объекта. Его размер может меняться в зависимости от того, относится ли он к кодировке ANSII, Юникод или является управляющим символом. Соседние символы в документе совершенно необязательно являются соседними в двоичном файле.

    • Character Position (CP)

      Позиция символа (CP) — это 32-разрядное целое число без знака, которое определяет расположение индекса символа в тексте документа.

    • Структура Pcd

      Структура Pcd указывает положение текста в потоке документа Word, а также некоторые свойства текста.

  • Plc

    Структура PLC представляет собой массив позиций символов, за которым следует массив элементов данных. Разные структуры Plc имеют разные имена и функции. Например, структура Plcbkf состоит из закладок и указателей на закладки.

  • Структура PlcPcd

    Структура PlcPcd является структурой PLC, которая сопоставляет массив позиций символов со структурами Pcd. Другими словами, она сопоставляет позиции символов с символами в тексте документа.

Извлечение текста из файлов Word

Формальный алгоритм для извлечения текста приведен в документах об открытых спецификациях на сайте MSDN в подразделе 2.4.1 Retrieving Text, кроме того, в подразделе 3.1 Example of a Clx раздела с примерами приведен пример реализации части данной процедуры. Здесь описана упрощенная версия всего процесса.

Порядок извлечения текста из документа Word

  1. Считайте файл DOC в поток данных.

  2. Начните считывание блока файловой информации со смещения 0 потока документа Word. Дополнительные сведения см. в разделе 2.5.15 How to read the FIB.

  3. Внутри блока файловой информации найдите структуру FibRgFcLcb97. Эта структура начинается с байта 54 блока файловой информации и состоит из последовательности 4-байтовых полей.

  4. Считайте поле FibRgFcLcb97.fcClx по байту 268 и поле FibRgFcLcb97.lcbClx по байту 272. Они указывают смещение расположения и размер структуры Clx.

  5. Начните считывать структуру Clx из потока таблицы со смещением, указанным в поле FibRgFcLcb97.fcClx.

  6. Внутри структуры Clx найдите структуру Pcdt, которая идет сразу за массивом .RgPrc, имеющим переменный размер и состоящим из структур Prc.

    Для каждого элемента этого массива выполните следующее:

    1. Считайте атрибут .clxt, который является байтом 0 структуры Prc. Если .clxt = 0x02, значит вы нашли Pcdt.

    2. Если .clxt = 0x01, считайте следующие два байта в качестве целого числа со знаком, а затем перейдите вперед на это число байт к следующему элементу массива.

  7. Внутри структуры Pcdt найдите структуру PlcPcd, которая начинается с пятого байта структуры Pcdt.

  8. Загрузите массив PlcPcd.aPcd и массив PlcPcd.aCp. Элементы этих массивов соотносятся друг с другом по значению индекса.

  9. Для каждой структуры Pcd в PlcPcd.aPcd выполните следующее:

    1. Считайте значение поля Pcd.Fc.fCompressed по биту 46 текущей структуры Pcd. Если получено значение 0, структура Pcd ссылается на 16-разрядный символ Юникода. Если получено значение 1, структура ссылается на 8-разрядный символ ANSI.

    2. Считайте значение Pcd.Fc, которое соответствует байтам 2–5 текущей структуры Pcd, и соответствующее значение позиции символа.

      • В случае с Юникодом текст в позиции символа, указанной текущим значением позиции, начинается со смещением, которое равно значению Pcd.Fc в потоке документа Word, и занимает два байта на символ.

      • В случае с ANSI текст в текущей позиции символа начинается со смещением, которое равно половине значения Pcd.Fc и занимает один байт на символ.

      В любом случае число символов, указанное текущей позицией символа, равно разности значений следующей позиции символа в массиве и текущей позиции символа.

В этой статье приведен лишь пример формата MS-DOC. Указанные в данной статье средства позволят вам с легкостью овладеть восстановлением данных. После изучения дополнительных материалов вы сможете приступить к восстановлению сведений о форматировании и других метаданных, а затем перейди к операциям сохранения.

Для получения дополнительных сведения см. следующие ресурсы:

msdn.microsoft.com

Двоичный формат файлов Microsoft Word 97—2007

Хотя MS-DOS и являлась текстовой операционной системой, лишённой графической оболочки, Word для DOS был первым текстовым процессором для IBM PC, который был способен отображать разметку текста, например, полужирный или курсивный текст в процессе редактирования. Однако он всё же не являлся в полном смысле WYSIWYG-редактором. Другие же текстовые процессоры, такие как WordStar и WordPerfect, использовали простой текстовый экран с кодами разметки, иногда текст был цветным.

Однако, поскольку в большинстве программного обеспечения под DOS применялись собственные труднозапоминаемые комбинации «горячих клавиш» для каждой команды (например, в Word’е для DOS сохранение файла выполнялось по комбинации ESC-T-S) и большинство секретарей умели пользоваться только WordPerfect, компании весьма неохотно переходили на конкурирующие с ним продукты, имеющие сравнительно небольшие преимущества.

1990—1995 годы

Первая версия Word для Windows, выпущенная в 1989 году, продавалась по цене 500 долларов США. Она демонстрировала выбранный компанией Майкрософт путь развития: как и сама Windows, она многое взяла от Macintosh, и использовала стандартные клавиатурные сокращения (например, CTRL-S для сохранения файла). После выпуска в следующем году Windows 3.0 продажи поползли вверх (Word 1.0 гораздо лучше работал с Windows 3.0, чем с более старыми версиями Windows/386 и Windows/286), главный конкурент — WordPerfect — не смог выпустить рабочую версию под Windows, что оказалось для него смертельной ошибкой. Версия 2.0 утвердила WinWord на позиции лидера рынка.

У Word для Macintosh никогда не было серьёзных конкурентов, даже несмотря на наличие программ вроде Nisus, предоставлявшую возможность выделения нескольких несвязных кусков текста (появившуюся только в Word 2002 из Office XP) и несмотря на мнение многих пользователей об отсутствии кардинальных различий между версиями 3.01, выпущенной в 1987 году и версией 5.0, выпущенной в 1991. Однако, версия 6.0 для Macintosh, вышедшая в 1994 году, была многими воспринята довольно скептически. Это была первая версия без значительных отличий в коде ядра между версиями под Windows и под Mac. Версия под Windows, следовавшая за 2.0, была пронумерована как 6.0 для координации названия версий под разные платформы.

Последовавшие версии добавляли возможности, выходящие за рамки простого текстового процессора. Инструменты рисования позволяли выполнять примитивные операции вёрстки, такие как добавление графики в документ, хотя, естественно, специализированные программы для вёрстки лучше справляются с этими задачами. Внедрение объектов, сравнение версий документа, мультиязычная поддержка и многие другие возможности были добавлены за последовавшие несколько лет.

Настоящее время

Microsoft Word является наиболее популярным из используемых в данный момент текстовых процессоров, что сделало его бинарный формат документа стандартом де-факто, и многие конкурирующие программы имеют поддержку совместимости с данным форматом. Расширение «.doc» на платформе IBM PC стало синонимом двоичного формата Word 97—2000. Фильтры экспорта и импорта в данный формат присутствуют в большинстве текстовых процессоров.Формат документа разных версий Word меняется, различия бывают довольно тонкими. Форматирование, нормально выглядящее в последней версии, может не отображаться в старых версиях программы, однако есть ограниченная возможность сохранения документа с потерей части форматирования для открытия в старых версиях продукта. Последняя версия MS Word 2007 "использует по умолчанию" формат основанный на Microsoft Office Open XML. Спецификация форматов файлов Word 97-2007 были опубликован Microsoft в 2008 году.[1][2] Ранее, большая часть информации, нужной для работы с данным форматом, добывалась посредством обратного инжиниринга, поскольку основная её часть отсутствовала в открытом доступе или была доступна лишь ограниченному числу партнеров и контролирующих организаций.

Как и прочие приложения из Microsoft Office, Word может расширять свои возможности посредством использования встроенного макроязыка (сначала использовался WordBasic, с версии Word 97 применяется VBA — Visual Basic для приложений). Однако это предоставляет широкие возможности для написания встраиваемых в документы вирусов (так называемые «макровирусы»). Наиболее ярким примером была эпидемия червя Melissa. В связи с этим, многие считают разумной рекомендацию всегда выставлять наивысший уровень настроек безопасности при использовании Word (Меню: «Tools>Macro>Security», «Сервис>Макрос>Безопасность…» в локализованных русских версиях). Также нелишним будет использовать антивирусное программное обеспечение. Первым вирусом, заражавшим документы Microsoft Word, был DMV, созданный в декабре 1994 года Дж. МакНамарой для демонстрации возможности создания макровирусов. Первым же вирусом, попавшим в "дикую природу" и вызвавшим первую в мире эпидемию макровирусов (это произошло в июле-августе 1995 г.), был Concept.

История версий

Версии для 1983, ноябрь Word 1

  • 1985 Word 2
  • 1986 Word 3
  • 1987 Word 4, также известный как Microsoft Word 4.0 для PC
  • 1989 Word 5
  • 1991 Word 5.5
  • Версии для Apple Macintosh:

    • 1985, январь Word 1 для Macintosh
    • 1987 Word 3
    • 1989 Word 4
    • 1991 Word 5le
    • 1993 Word 6
    • 1998 Word 98
    • 2000 Word 2001, последняя из версий, совместимых с Mac OS 9
    • 2001 Word v.X, первая версия исключительно для Mac OS X
    • 2004 Word 2004
    • 2008 Word 2008

    Версии для Microsoft Windows:

    • 1989, ноябрь Word для Windows
    • 1991 Word 2 для Windows
    • 1993 Word 6 для Windows (номер «6» был введён для продолжения линейки номеров DOS-версий, единой нумерации с Mac-версиями и с WordPerfect, лидером рынка среди текстовых процессоров на тот момент)
    • 1995 Word 95, также известный как Word 7
    • 1997 Word 97, также известный как Word 8
    • 1999 Word 2000, также известный как Word 9
    • 2001 Word 2002 или Word 10
    • 2001 Word XP см выше.
    • 2003 Word 2003, также известный как Word 11, однако официально именуемый Microsoft Office Word 2003
    • 2007 Word 2007, революционная смена интерфейса, поддержка формата OOXML (docx)

    Версии для SCO UNIX:

    Недокументированные возможности и курьёзы

    Следующие функции вводятся в любом месте документа с начала строки. Замена их на определённый текст осуществляется при нажатии клавиши Enter.

    Функция rand()

    =rand(x,y)

    В редакторе версии младше 2007 строка с командой будет заменена матрицей из панграмм:

    Съешь ещё этих мягких французских булок, да выпей чаю.

    Параметр x задаёт количество столбцов матрицы, y — количество строк. Параметры можно не указывать.

    В редакторе Word 2007 строка с данной функцией будет заменена на отрывок из текста справки, параметр x задаёт количество абзацев, y — количество предложений в каждом абзаце.

    Функция lorem()

    =lorem()

    В редакторе Word 2007 строка с данной функцией будет заменена на отрывок из текста Lorem ipsum.

    Курьёзные ошибки в модуле проверки русской орфографии

    • Набор фразы «Правоспособность-способность иметь права и нести гражданские обязанности» вызывает (в случае, если включена автоматическая проверка орфографии) незамедлительное закрытие приложения; при этом все открытые документы закрываются без сохранения изменений. В MS Word версии 2007 данная ошибка исправлена.
    • Модуль проверки орфографии в MS Word 2000 при наборе слова «мультиканальный» предлагает автозамену на фразу «мультик анальный» (как и модуль проверки орфографии в Firefox 3). Аналогичные курьёзы происходят с некоторыми другими словами: «стриптизерша» — «стриптиз ерша»; «отмелькала» — «отмель кала»; «спецназовец» — «спецназ овец»; «завязочками» — «завяз очками» и др. В Word 2003 пример не работает.
    • При наборе в MS Word 2000 фразы «Хочу избежать службу в армии» модуль проверки орфографии в качестве одного из вариантов исправлений предлагает текст «Ошибка в управлении. Глагол „избежать“ требует дополнения в родительном падеже. Например: „Никому не удалось избежать службы в армии“.»

    Примечания

    Ссылки

    Литература

    • Tsang, Cheryl. Microsoft: First Generation. New York: John Wiley & Sons, Inc. ISBN 0-471-33206-2.

    dic.academic.ru

    word - Википедия

    Microsoft Word Тип Разработчик Операционная система Последняя версия Читаемые форматы файлов Создаваемые форматы файлов Лицензия Сайт

    Текстовый процессор

    Microsoft

    Microsoft Windows

    2016 (2015)

    DOC, DOCX[d], Rich Text Format, Текстовые данные, [d][1], [d], [d][1] и [d][1]

    DOC, DOCX[d], [d][1], Rich Text Format, Текстовые данные, [d], [d][1] и [d][1]

    Проприетарное программное обеспечение

    office.microsoft.com/ru-ru/word

     Microsoft Word на Викискладе
    Microsoft Word (macOS) Тип Разработчик Операционная система Последняя версия Читаемые форматы файлов Создаваемые форматы файлов Лицензия Сайт

    Текстовый процессор

    Microsoft

    macOS

    2016 (2015)

    DOC, DOCX[d], Rich Text Format, Текстовые данные, [d][1], [d], [d][1] и [d][1]

    DOC, DOCX[d], [d][1], Rich Text Format, Текстовые данные, [d], [d][1] и [d][1]

    Проприетарное программное обеспечение

    microsoft.com/rus/mac/word

     [[commons:Category:Microsoft Word|Microsoft Word (macOS) на Викискладе]]

    Microsoft Word (часто — MS Word, WinWord или просто Word) — текстовый процессор, предназначенный для создания, просмотра и редактирования текстовых документов, с локальным применением простейших форм таблично-матричных алгоритмов. Выпускается корпорацией Microsoft в составе пакета Microsoft Office. Первая версия была написана (Richard Brodie) для IBM PC, использующих DOS, в 1983 году. Позднее выпускались версии для Apple Macintosh (1984), SCO UNIX и Microsoft Windows (1989). Текущей версией является Microsoft Office Word 2016 для Windows и macOS.

    Начало[ | ]

    Microsoft Word многим обязан  — текстовому процессору с оригинальным графическим интерфейсом, разработанному в исследовательском центре «Xerox PARC». Создатель Bravo Чарльз Симони (Charles Simonyi) покинул PARC в 1981 году. Тем же летом Симони переманил Броди, с которым вместе работал над Bravo.

    Первый выпуск Word для MS-DOS состоялся в конце 1983 года. Он был плохо принят рынком, продажи снижало наличие конкурирующего продукта — WordPerfect.

    Однако версия для «макинтоша», выпущенная в 1985 году, получила широкое распространение. Через два года «Word 3.01 для Macintosh» усилил позиции (версия 3.0 изобиловала ошибками и быстро была заменена). Как и прочее программное обеспечение для «макинтоша», Word был полностью WYSIWYG-редактором (принцип «What You See Is What You Get» — «получаю то, что вижу»).

    Хотя MS-DOS и являлась текстовой операционной системой, лишённой графической оболочки, Word для DOS был первым текстовым процессором для IBM PC, который был способен отображать разметку текста, например, полужирный или курсивный текст в процессе редактирования. Однако он всё же не являлся в полном смысле WYSIWYG-редактором. Другие же текстовые процессоры, такие как и WordPerfect, использовали простой текстовый экран с кодами разметки, иногда текст был цветным.

    Однако, поскольку в большинстве программного обеспечения под DOS применялись собственные труднозапоминаемые комбинации «горячих клавиш» для каждой команды (например, в Word’е для DOS сохранение файла выполнялось по комбинации ESC-T-S) и большинство секретарей умели пользоваться только WordPerfect, компании-пользователи WordPerfect весьма неохотно переходили на конкурирующие с ним продукты, имеющие сравнительно небольшие преимущества.

    1990—1995 годы[ | ]

    Первая версия Word для Windows, выпущенная в 1989 году, продавалась по цене $500. Она демонстрировала выбранный компанией «Майкрософт» путь развития: как и сама Windows, она многое взяла от Macintosh и использовала стандартные клавиатурные сокращения (например, Ctrl+S для сохранения файла). После выпуска в следующем году Windows 3.0 продажи поползли вверх (Word 1.0 гораздо лучше работал с Windows 3.0, чем с более старыми версиями Windows x386 и Windows x286), главный конкурент — WordPerfect — не смог выпустить рабочую версию под Windows, что оказалось для него смертельной ошибкой. Версия 2.0 утвердила WinWord на позиции лидера рынка.

    Последовавшие версии добавляли возможности, выходящие за рамки простого текстового процессора. Инструменты рисования позволяли выполнять примитивные операции вёрстки, такие, как добавление графики в документ, хотя, естественно, специализированные программы для вёрстки лучше справляются с этими задачами. Внедрение объектов, сравнение версий документа, мультиязычная поддержка и многие другие возможности были добавлены за последовавшие несколько лет.

    Настоящее время[ | ]

    Microsoft Word является наиболее популярным из используемых в данный момент текстовых процессоров, что сделало его бинарный формат документа стандартом де-факто, и многие конкурирующие программы имеют поддержку совместимости с данным форматом. Расширение «.doc» на платформе IBM PC стало синонимом двоичного формата Word 97—2000. Фильтры экспорта и импорта в данный формат присутствуют в большинстве текстовых процессоров. Формат документа разных версий Word меняется, различия бывают довольно тонкими. Форматирование, нормально выглядящее в последней версии, может не отображаться в старых версиях программы, однако есть ограниченная возможность сохранения документа с потерей части форматирования для открытия в старых версиях продукта. Последняя версия MS Word 2007 «использует по умолчанию» формат, основанный на XML, — Microsoft Office Open XML. Спецификации форматов файлов Word 97-2007 были опубликованы Microsoft в 2008 году[2][3]. Ранее большая часть информации, нужной для работы с данным форматом, добывалась посредством обратного инжиниринга, поскольку основная её часть отсутствовала в открытом доступе или была доступна лишь ограниченному числу партнёров и контролирующих организаций.

    Как и прочие приложения из Microsoft Office, Word может расширять свои возможности посредством использования встроенного макроязыка (сначала использовался , с версии Word 97 применяется VBA — Visual Basic для приложений). Однако это предоставляет широкие возможности для написания встраиваемых в документы вирусов (так называемые «макровирусы»). Наиболее ярким примером была эпидемия червя Melissa. В связи с этим многие считают разумной рекомендацию всегда выставлять наивысший уровень настроек безопасности при использовании Word (Меню: «Tools>Macro>Security», «Сервис>Макрос>Безопасность…» в локализованных русских версиях). Также нелишним будет использовать антивирусное программное обеспечение. Первым вирусом, заражавшим документы Microsoft Word, был DMV, созданный в декабре 1994 года Дж. Мак-Намарой для демонстрации возможности создания макровирусов. Первым же вирусом, попавшим в «дикую природу» и вызвавшим первую в мире эпидемию макровирусов (это произошло в июле-августе 1995 года), был Concept.

    12 августа 2009 года суд штата Техас запретил продажу программы Word на территории США, в связи с тем, что Microsoft незаконно использует метод чтения XML-файлов, патент на который принадлежит канадской компании i4i.

    История версий[ | ]

    Версии для MS-DOS:

    • 1983, ноябрь Word 1
    • 1985 Word 2
    • 1986 Word 3
    • 1987 Word 4, также известный как Microsoft Word 4.0 для PC
    • 1989 Word 5
    • 1991 Word 5.5
    • 1993 Word 6.0, последняя версия для DOS

    Версии для Apple OS X:

    • 1985, январь Word 1 для Macintosh
    • 1987 Word 3
    • 1989 Word 4
    • 1991 Word 5le
    • 1993 Word 6
    • 1998 Word 98
    • 2000 Word 2001, последняя из версий, совместимых с Mac OS 9
    • 2001 Word v.X, первая версия исключительно для Mac OS X
    • 2004 Word 2004
    • 2008 Word 2008
    • 2011 Word 2011
    • 2015 Word 2016

    Версии для Apple iOS:

    Версии для Microsoft Windows:

    • ноябрь 1989 Word для Windows
    • 1991 Word 2 для Windows
    • 1993 Word 6 для Windows (номер «6» был введён для продолжения линейки номеров DOS-версий, единой нумерации с Mac-версиями и с WordPerfect, лидером рынка среди текстовых процессоров на тот момент)
    • 1995 Word 95 (Word 7)
    • 1997 Word 97 (Word 8)
    • 1999 Word 2000 (Word 9)
    • 2001 Word 2002 (Word 10)
    • 2003 Word 2003 (также известный как Word 11, однако официально именуемый Microsoft Office Word 2003)
    • 2007 Word 2007 (революционная смена интерфейса, поддержка формата OOXML — *.docx)
    • 2010 Word 2010
    • 2012 Word 2013
    • 2015 Word 2016
    • 2018 Word 2019

    Версии для SCO UNIX:

    Парольная защита документов MS Word[ | ]

    На документ Microsoft Word могут быть установлены 3 типа паролей:

    • Пароль для открытия документа[4]
    • Пароль для изменения документа[5]
    • Пароль на внесение примечаний и исправлений (для версий 2003 и ниже). В новых версиях MS Word 2007\2010 этот тип пароля называется «Пароль для Ограничения форматирования и редактирования»[6]

    Вне зависимости от версий MS Word, в которой был создан документ, «пароль разрешения записи» и «пароль на внесение примечаний и исправлений» можно удалить из документа мгновенно[7]. Эти типы паролей служат не столь для защиты документа, как для обеспечения коллективной работы над документом. А основную защиту документа от несанкционированного доступа обеспечивает «пароль для открытия документа».

    В документах ранних версиях MS Word (до MS Office 2003 включительно) пароль для открытия файла может быть без проблем взломан.

    В последних версия MS Office 2007 \ 2010 компания Microsoft использует стойкий алгоритм шифрования AES с 128-битным ключом. Формирование ключа происходит путём 50000 \ 100000 кратного применения SHA-1 хэш функции, что делает перебор паролей крайне медленным, и при использовании стойкого пароля шансы его подобрать близки к нулю[8].

    Критика[ | ]

    Чаще всего Microsoft Word подвергается критике за низкую безопасность, закрытый исходный код, отсутствие полноценной кроссплатформенности[9]. Ранее Word критиковали также за закрытый формат файлов (открытая документация на бинарные форматы появилась только в начале 2008 года). Это побудило отдельные организации перейти к использованию других текстовых процессоров, таких как OpenOffice Writer, входящего в офисный пакет OpenOffice.org. Инструментов Microsoft Word недостаточно для создания качественного полиграфического продукта[10].

    Недокументированные возможности и курьёзы[ | ]

    Следующие функции вводятся в любом месте документа с начала строки. Замена их на определённый текст осуществляется при нажатии клавиши Enter.

    Функция rand()[ | ]

    =rand(x,y)

    В редакторе версии младше 2007 строка с командой будет заменена матрицей из панграмм:

    Съешь ещё этих мягких французских булок, да выпей чаю.

    Параметр x задаёт количество столбцов матрицы, y — количество строк. Параметры можно не указывать.

    В редакторе Word 2007 строка с данной функцией будет заменена на отрывок из текста справки, параметр x задаёт количество абзацев, y — количество предложений в каждом абзаце. Функция =rand.old(x, y) работает как =rand(x, y) в более ранних версиях редактора.

    Функция lorem()[ | ]

    =lorem()

    В редакторах Word 2007 и 2010 строка с данной функцией будет заменена на отрывок из текста Lorem ipsum.

    Курьёзные ошибки в модуле проверки русской орфографии версии 2003 года[ | ]

    Модуль проверки русской орфографии, поставляемый с русифицированными версиями Microsoft Word за исключением MS Word 2013, является упрощенной версией системы Орфо, производимой российской компанией ООО «Информатик».

    • Набор фразы Правоспособность — способность лица иметь гражданские права и нести обязанности вызывает (иногда после нажатия Enter), если включена автоматическая проверка орфографии, незамедлительное закрытие приложения без сохранения изменений. Данную ошибку эксплуатирует троян «Trojan.WordCrash» (по классификации антивирусной лаборатории Dr.Web), который добавляет данную фразу во все документы с расширением *.doc и *.rtf.
    • При наборе в MS Word 97—2010 фразы «Хочу избежать службу в армии» модуль проверки грамматики в качестве одного из вариантов исправлений предлагает текст «Ошибка в управлении. Глагол „избежать“ требует дополнения в родительном падеже. Например: „Никому не удалось избежать службы в армии“.» Проверка грамматики реагирует на словосочетание «избежать что-либо» (при правильном «избежать чего-либо»).
    • Word 2003 не знает цвет «голубой». Более ранние версии Word этот цвет знали.

    Почти все недоработки были исправлены в Microsoft Word 2003 SP3 и последующих версиях продукта.

    См. также[ | ]

    Примечания[ | ]

    Литература[ | ]

    • Tsang, Cheryl. Microsoft: First Generation. New York: John Wiley & Sons, Inc. ISBN 0-471-33206-2.
    • Дэн Гукин. Word 2010 для чайников = Word 2010 for Dummies. — М.: , 2010. — С. 352. — ISBN 978-5-8459-1681-5.

    Ссылки[ | ]

    encyclopaedia.bid

    word вики

    Microsoft Word Тип Разработчик Операционная система Последняя версия Читаемые форматы файлов Создаваемые форматы файлов Лицензия Сайт

    Текстовый процессор

    Microsoft

    Microsoft Windows

    2016 (2015)

    DOC, DOCX[d], Rich Text Format, Текстовые данные, Office Open XML Wordprocessing Document, Strict, ISO/IEC 29500:2008, with Microsoft extensions[d][1], Microsoft Office XML formats[d], OpenDocument Text, version 1.1[d][1] и OpenDocument Text, version 1.2[d][1]

    DOC, DOCX[d], Office Open XML Wordprocessing Document, Strict, ISO/IEC 29500:2008, with Microsoft extensions[d][1], Rich Text Format, Текстовые данные, Microsoft Office XML formats[d], OpenDocument Text, version 1.1[d][1] и OpenDocument Text, version 1.2[d][1]

    Проприетарное программное обеспечение

    office.microsoft.com/ru-ru/word

     Microsoft Word на Викискладе
    Microsoft Word (macOS) Тип Разработчик Операционная система Последняя версия Читаемые форматы файлов Создаваемые форматы файлов Лицензия Сайт

    Текстовый процессор

    Microsoft

    macOS

    2016 (2015)

    DOC, DOCX[d], Rich Text Format, Текстовые данные, Office Open XML Wordprocessing Document, Strict, ISO/IEC 29500:2008, with Microsoft extensions[d][1], Microsoft Office XML formats[d], OpenDocument Text, version 1.1[d][1] и OpenDocument Text, version 1.2[d][1]

    DOC, DOCX[d], Office Open XML Wordprocessing Document, Strict, ISO/IEC 29500:2008, with Microsoft extensions[d][1], Rich Text Format, Текстовые данные, Microsoft Office XML formats[d], OpenDocument Text, version 1.1[d][1] и OpenDocument Text, version 1.2[d][1]

    Проприетарное программное обеспечение

    microsoft.com/rus/mac/word

     [[commons:Category:Microsoft Word|Microsoft Word (macOS) на Викискладе]]

    Microsoft Word (часто — MS Word, WinWord или просто Word) — текстовый процессор, предназначенный для создания, просмотра и редактирования текстовых документов, с локальным применением простейших форм таблично-матричных алгоритмов. Выпускается корпорацией Microsoft в составе пакета Microsoft Office. Первая версия была написана Ричардом Броди (Richard Brodie) для IBM PC, использующих DOS, в 1983 году. Позднее выпускались версии для Apple Macintosh (1984), SCO UNIX и Microsoft Windows (1989). Текущей версией является Microsoft Office Word 2016 для Windows и macOS.

    Начало[ | ]

    Microsoft Word многим обязан Bravo — текстовому процессору с оригинальным графическим интерфейсом, разработанному в исследовательском центре «Xerox PARC». Создатель Bravo Чарльз Симони (Charles Simonyi) покинул PARC в 1981 году. Тем же летом Симони переманил Броди, с которым вместе работал над Bravo.

    Первый выпуск Word для MS-DOS состоялся в конце 1983 года. Он был плохо принят рынком, продажи снижало наличие конкурирующего продукта — WordPerfect.

    Однако версия для «макинтоша», выпущенная в 1985 году, получила широкое распространение. Через два года «Word 3.01 для Macintosh» усилил позиции (версия 3.0 изобиловала ошибками и быстро была заменена). Как и прочее программное обеспечение для «макинтоша», Word был полностью WYSIWYG-редактором (принцип «What You See Is What You Get» — «получаю то, что вижу»).

    Хотя MS-DOS и являлась текстовой операционной системой, лишённой графической оболочки, Word для DOS был первым текстовым процессором для IBM PC, который был способен отображать разметку текста, например, полужирный или курсивный текст в процессе редактирования. Однако он всё же не являлся в полном смысле WYSIWYG-редактором. Другие же текстовые процессоры, такие как WordStar и WordPerfect, использовали простой текстовый экран с кодами разметки, иногда текст был цветным.

    Однако, поскольку в большинстве программного обеспечения под DOS применялись собственные труднозапоминаемые комбинации «горячих клавиш» для каждой команды (например, в Word’е для DOS сохранение файла выполнялось по комбинации ESC-T-S) и большинство секретарей умели пользоваться только WordPerfect, компании-пользователи WordPerfect весьма неохотно переходили на конкурирующие с ним продукты, имеющие сравнительно небольшие преимущества.

    1990—1995 годы[ | ]

    Первая версия Word для Windows, выпущенная в 1989 году, продавалась по цене $500. Она демонстрировала выбранный компанией «Майкрософт» путь развития: как и сама Windows, она многое взяла от Macintosh и использовала стандартные клавиатурные сокращения (например, Ctrl+S для сохранения файла). После выпуска в следующем году Windows 3.0 продажи поползли вверх (Word 1.0 гораздо лучше работал с Windows 3.0, чем с более старыми версиями Windows x386 и Windows x286), главный конкурент — WordPerfect — не смог выпустить рабочую версию под Windows, что оказалось для него смертельной ошибкой. Версия 2.0 утвердила WinWord на позиции лидера рынка.

    Последовавшие версии добавляли возможности, выходящие за рамки простого текстового процессора. Инструменты рисования позволяли выполнять примитивные операции вёрстки, такие, как добавление графики в документ, хотя, естественно, специализированные программы для вёрстки лучше справляются с этими задачами. Внедрение объектов, сравнение версий документа, мультиязычная поддержка и многие другие возможности были добавлены за последовавшие несколько лет.

    Настоящее время[ | ]

    Microsoft Word является наиболее популярным из используемых в данный момент текстовых процессоров, что сделало его бинарный формат документа стандартом де-факто, и многие конкурирующие программы имеют поддержку совместимости с данным форматом. Расширение «.doc» на платформе IBM PC стало синонимом двоичного формата Word 97—2000. Фильтры экспорта и импорта в данный формат присутствуют в большинстве текстовых процессоров. Формат документа разных версий Word меняется, различия бывают довольно тонкими. Форматирование, нормально выглядящее в последней версии, может не отображаться в старых версиях программы, однако есть ограниченная возможность сохранения документа с потерей части форматирования для открытия в старых версиях продукта. Последняя версия MS Word 2007 «использует по умолчанию» формат, основанный на XML, — Microsoft Office Open XML. Спецификации форматов файлов Word 97-2007 были опубликованы Microsoft в 2008 году[2][3]. Ранее большая часть информации, нужной для работы с данным форматом, добывалась посредством обратного инжиниринга, поскольку основная её часть отсутствовала в открытом доступе или была доступна лишь ограниченному числу партнёров и контролирующих организаций.

    Как и прочие приложения из Microsoft Office, Word может расширять свои возможности посредством использования встроенного макроязыка (сначала использовался WordBasic, с версии Word 97 применяется VBA — Visual Basic для приложений). Однако это предоставляет широкие возможности для написания встраиваемых в документы вирусов (так называемые «макровирусы»). Наиболее ярким примером была эпидемия червя Melissa. В связи с этим многие считают разумной рекомендацию всегда выставлять наивысший уровень настроек безопасности при использовании Word (Меню: «Tools>Macro>Security», «Сервис>Макрос>Безопасность…» в локализованных русских версиях). Также нелишним будет использовать антивирусное программное обеспечение. Первым вирусом, заражавшим документы Microsoft Word, был DMV, созданный в декабре 1994 года Дж. Мак-Намарой для демонстрации возможности создания макровирусов. Первым же вирусом, попавшим в «дикую природу» и вызвавшим первую в мире эпидемию макровирусов (это произошло в июле-августе 1995 года), был Concept.

    12 августа 2009 года суд штата Техас запретил продажу программы Word на территории США, в связи с тем, что Microsoft незаконно использует метод чтения XML-файлов, патент на который принадлежит канадской компании i4i.

    История версий[ | ]

    Версии для MS-DOS:

    • 1983, ноябрь Word 1
    • 1985 Word 2
    • 1986 Word 3
    • 1987 Word 4, также известный как Microsoft Word 4.0 для PC
    • 1989 Word 5
    • 1991 Word 5.5
    • 1993 Word 6.0, последняя версия для DOS

    Версии для Apple OS X:

    • 1985, январь Word 1 для Macintosh
    • 1987 Word 3
    • 1989 Word 4
    • 1991 Word 5le
    • 1993 Word 6
    • 1998 Word 98
    • 2000 Word 2001, последняя из версий, совместимых с Mac OS 9
    • 2001 Word v.X, первая версия исключительно для Mac OS X
    • 2004 Word 2004
    • 2008 Word 2008
    • 2011 Word 2011
    • 2015 Word 2016

    Версии для Apple iOS:

    Версии для Microsoft Windows:

    • ноябрь 1989 Word для Windows
    • 1991 Word 2 для Windows
    • 1993 Word 6 для Windows (номер «6» был введён для продолжения линейки номеров DOS-версий, единой нумерации с Mac-версиями и с WordPerfect, лидером рынка среди текстовых процессоров на тот момент)
    • 1995 Word 95 (Word 7)
    • 1997 Word 97 (Word 8)
    • 1999 Word 2000 (Word 9)
    • 2001 Word 2002 (Word 10)
    • 2003 Word 2003 (также известный как Word 11, однако официально именуемый Microsoft Office Word 2003)
    • 2007 Word 2007 (революционная смена интерфейса, поддержка формата OOXML — *.docx)
    • 2010 Word 2010
    • 2012 Word 2013
    • 2015 Word 2016
    • 2018 Word 2019

    Версии для SCO UNIX:

    Парольная защита документов MS Word[ | ]

    На документ Microsoft Word могут быть установлены 3 типа паролей:

    • Пароль для открытия документа[4]
    • Пароль для изменения документа[5]
    • Пароль на внесение примечаний и исправлений (для версий 2003 и ниже). В новых версиях MS Word 2007\2010 этот тип пароля называется «Пароль для Ограничения форматирования и редактирования»[6]

    Вне зависимости от версий MS Word, в которой был создан документ, «пароль разрешения записи» и «пароль на внесение примечаний и исправлений» можно удалить из документа мгновенно[7]. Эти типы паролей служат не столь для защиты документа, как для обеспечения коллективной работы над документом. А основную защиту документа от несанкционированного доступа обеспечивает «пароль для открытия документа».

    В документах ранних версиях MS Word (до MS Office 2003 включительно) пароль для открытия файла может быть без проблем взломан.

    В последних версия MS Office 2007 \ 2010 компания Microsoft использует стойкий алгоритм шифрования AES с 128-битным ключом. Формирование ключа происходит путём 50000 \ 100000 кратного применения SHA-1 хэш функции, что делает перебор паролей крайне медленным, и при использовании стойкого пароля шансы его подобрать близки к нулю[8].

    Критика[ | ]

    Чаще всего Microsoft Word подвергается критике за низкую безопасность, закрытый исходный код, отсутствие полноценной кроссплатформенности[9]. Ранее Word критиковали также за закрытый формат файлов (открытая документация на бинарные форматы появилась только в начале 2008 года). Это побудило отдельные организации перейти к использованию других текстовых процессоров, таких как OpenOffice Writer, входящего в офисный пакет OpenOffice.org. Инструментов Microsoft Word недостаточно для создания качественного полиграфического продукта[10].

    Недокументированные возможности и курьёзы[ | ]

    Следующие функции вводятся в любом месте документа с начала строки. Замена их на определённый текст осуществляется при нажатии клавиши Enter.

    Функция rand()[ | ]

    =rand(x,y)

    В редакторе версии младше 2007 строка с командой будет заменена матрицей из панграмм:

    Съешь ещё этих мягких французских булок, да выпей чаю.

    Параметр x задаёт количество столбцов матрицы, y — количество строк. Параметры можно не указывать.

    В редакторе Word 2007 строка с данной функцией будет заменена на отрывок из текста справки, параметр x задаёт количество абзацев, y — количество предложений в каждом абзаце. Функция =rand.old(x, y) работает как =rand(x, y) в более ранних версиях редактора.

    Функция lorem()[ | ]

    =lorem()

    В редакторах Word 2007 и 2010 строка с данной функцией будет заменена на отрывок из текста Lorem ipsum.

    Курьёзные ошибки в модуле проверки русской орфографии версии 2003 года[ | ]

    Модуль проверки русской орфографии, поставляемый с русифицированными версиями Microsoft Word за исключением MS Word 2013, является упрощенной версией системы Орфо, производимой российской компанией ООО «Информатик».

    • Набор фразы Правоспособность — способность лица иметь гражданские права и нести обязанности вызывает (иногда после нажатия Enter), если включена автоматическая проверка орфографии, незамедлительное закрытие приложения без сохранения изменений. Данную ошибку эксплуатирует троян «Trojan.WordCrash» (по классификации антивирусной лаборатории Dr.Web), который добавляет данную фразу во все документы с расширением *.doc и *.rtf.
    • При наборе в MS Word 97—2010 фразы «Хочу избежать службу в армии» модуль проверки грамматики в качестве одного из вариантов исправлений предлагает текст «Ошибка в управлении. Глагол „избежать“ требует дополнения в родительном падеже. Например: „Никому не удалось избежать службы в армии“.» Проверка грамматики реагирует на словосочетание «избежать что-либо» (при правильном «избежать чего-либо»).
    • Word 2003 не знает цвет «голубой». Более ранние версии Word этот цвет знали.

    Почти все недоработки были исправлены в Microsoft Word 2003 SP3 и последующих версиях продукта.

    См. также[ | ]

    Примечания[ | ]

    Литература[ | ]

    Ссылки[ | ]

    www.ruwikiorg.ru


    Смотрите также