Структура дополнительных метаданных для разных типов файлов

Для всех файлов помещенных или загруженных в/из облака

  1. bucket_name: str (обязательное поле) - имя bucket-а в котором лежит файл. Включено при анализе файла из облачной хранилки (пример: "dedoc")
  2. cloud_file_path: str (обязательное поле) абслоютный путь файла в бакете "bucket_name" на облаке.

Docx/doc/odt файлов

  1. document_subject: str (необязательное поле) - тема содержимого документа.
  2. keywords: str (необязательное поле) - набор ключевых слов с разделителями для поддержки поиска и индексации.
  3. category: str (необязательное поле) - категоризация содержимого документа. Примеры значений этого свойства могут включать: резюме, письмо, финансовый прогноз, предложение, техническую презентацию и т.д.
  4. author: str (необязательное поле) - имя автора содержимого документа.
  5. last_modified_by: str (необязательное поле) - Пользователь, выполнивший последнюю модификацию. Идентификация зависит от среды. Примеры включают имя, адрес электронной почты или идентификатор сотрудника.
  6. created_date: str (необязательное поле) - дата создания документа.
  7. modified_date: str (необязательное поле) - последняя дата модификации документа.
  8. last_printed_date: str (необязательное поле) - дата и время последней печати документа.