Кто, зачем и как (о блог-проекте) === Мой основной персональный Web-ресурс тут:

четверг, 10 июня 2010 г.

О чем говорил на Докфлоу Atle Skjekkeland

В бытность мою представителем западного вендора довелось бывать на ежегодных конференциях, где, как водится выступали разные приглашенные звезды – keynotes speakers. И реально это были самые интересные и насыщенные выступления, несмотря на внешнюю простоту. Понятно же, что время ограничено, а человеку, особенно которому есть что сказать, хочется сказать много. И приходится просто «развешивать флажки» – кому надо сами доберутся до деталей. Это вовсе не презентация «для чайников». (Хотя чайники и не будут чувствовать себя таковым, слушая ее.)

А еще сохранилась бауманская привычка читать первоисточники. Человек показал нам куда копать — и на том спасибо, дальше как-нибудь сами.

Итак,
8 причин для выбора стратегии управления информацией -
пока не стало слишком поздно...
Atle Skjekkeland
вице-президент AIIM

Сначала одно предварительное соображение.
Почему-то у нас все богатство понятия ECM стремятся свести к электронному документообороту, а иногда и уже — только к Records Management. Да помилуйте, там уже слоны прошли. Зрелые откатанные технологии, едва ли можно жать какого-то серьезного прорыва на этом фронте. Фокус уже давно сместился. ECM – Enterprise Content Management – это практически все, что не ERP.
А у нас и Докфлоу — главное событие в мире документооборота, никак мы не хотим посмотреть шире.

AIIM смотрит на ECM предельно широко, поэтому и попадают в их презентации вещи, кажущиеся нам «не из этой оперы». Но как известно, самые интересные проекты и решения создаются в процессе интеграции разных систем, на стыках различных задач. И это все — управление корпоративным содержанием, (или как там это назвать по-русски).

Если и нам встать на такую же позицию, что ECM – это управление всей информацией предприятия, то станет понятным, почему их так беспокоит The Data Deluge

см. The Economist, Feb, 25th, 2010
(http://www.economist.com/opinion/displaystory.cfm?story_id=15579717&source=login_payBarrier )

В статье говорится о том, что информация растет небывалыми темпами. Но мы не боимся этих экзобайтов, да? – наверное лишь потому, что не осознаем, насколько это много. А ведь это рост на много порядков, по сравнению с нынешними. И при том, что пользователи захотят скорость поиска не меньше, чем сегодня. Конечно, сравнение данных Wal-Mart с библиотекой Конгресса немного странно – нет смысла сопоставлять столь различные по ценности данные исключительно в терминах объемов, но в остальном проблема поставлена четко — данные действительно растут очень быстро.

Что это означает для ECM? Что традиционные механизмы классификации и поиска информации не будут эффективны. Потому что для классификации обычно используются иерархические структуры папок и справочников. И есть рационально обоснованные количества элементов в одной папке и число уровне вложенности — просто мозг больше не воспринимает. Вот тут то мы и упремся. Попробуйте-ка поработайте с каталогом, у которого, скажем, хотя бы 20 уровне вложенности.

По прогнозам британских ученых это случится совсем скоро. А наши СЭД вовсе не готовы к таким масштабам. Что делать? Например, заимствовать средства организации и визуализации больших массивов информации из смежных отраслей, из управления знаниями. Или что еще люди изобретут (вот кстати и тема для молодых ученых — способы организации и представления больших массивов данных).

А насколько все эти данные полезны? Находясь в эйфории от того, насколько легко стало эти данные производить, мы уже не задумываемся об их качестве и храним все подряд - на всякий случай. Вспомните, как было раньше, когда фотографировали на пленку. Считали каждый кадр и думали — стоит щелкать или нет. А потом еще думали – стоит ли печатать. Одну фотографию или несколько. А сейчас что? – не глядя сливаем все фотки из камеры в альбом и редко когда доходят руки отсортировать и оставить только достойные кадры. (Не знаю кто как, а я удаляю только явный брак, в остальном нет сил копаться.) И ровно таким же образом забиваются никому не нужными документами корпоративные хранилища, особенно архивы. Я не покушаюсь на Compliance — то что надо, будем хранить. Но на 100% уверен, что еще много всякой ерунды сохраняется «на всякий случай», просто потому что лень думать.

Здесь можно сформулировать и второй вопрос — о разумности хранения информации и критериях ее отбора. На сегодняшний день этот вопрос в СЭД проработан слабо. И не надо тут поминать пресловутый Перечень! – там только рекомендованные минимальные сроки хранения, многие хранят и дольше. (А смысл?) И не вся информация описывается этим перечнем.

Идем дальше.
На 4-м слайде график от IDC показывает нам, что возможности по созданию информации обгоняют возможности по ее хранению. Ну и что?

А вот что: полным ходом идет строительство ЦОДов и туда инвестируются немалые деньги. По меркам рынка документооборота просто огромные. Хранилища данных становятся внешними. Да, пока компании боятся отдавать на сторону свои данные, но выбора-то все равно нет. Будет как с котельными и электростанциями — раньше каждый строил для себя, потом появились единые сети. (Можно конечно, иметь свое хозяйство, но только так, на всякий пожарный.)

А что у нас с документооборотом в облаках? – Пока тихо. Может что и есть, но я не в курсе. Не на слуху это пока. А деваться-то некуда – storage будет на аутсорсинге, и работать нашим СЭДам придется с удаленными облачными хранилищами. Логически может особой разницы нет, но технических проблем будет по уши.

Такое изобилие данных делает их практически недоступными. «Как извлечь пользу из всей этой информации? Люди должны быть обеспокоены тем, как мы будем обучать следующие поколения, не только ученых, но правительственных служащих и работников корпораций.» – сегодня в школе не учат тому, как работать с таким количеством информации. Уже даже появился новый термин - «big data», по аналогии с «большим взрывом».

В последние годы IBM, Oracle, Microsoft и SAP потратили больше 15 млрд. долл. на покупку фирм, специализирующихся в области управления данными и анализа. И этот сектор растет примерно в два раза быстрее, чем вся отрасль программного обеспечения.

Что нам с того? – Будет и на нашей улице праздник, хватит уже сливать все деньги на закупку железа и ERP.

Что еще пишет The Economist? – Будут востребованы новые компетенции — data scientist, который сочетает навыки программирования, статистики и storytelling чтобы извлекать золотые самородки из куч информации.
(Снова чем не тема для исследований!) А главный экономист Google, Hal Varian, вообще говорит, что работа статистика будет самой «секси». Потому что данных полно, а найти в них смысл еще нужно уметь.

Причем здесь СЭД? – при том, что они накапливают тоже огромное количество статистических данных о работе пользователей с документами, об исполнении и проч. Но эта информация используется очень слабо – в виде довольно примитивных формальных отчетов чаще всего. И дело не в технических ограничениях систем, а в том, что никто не может правильно поставить вопрос — какие отчеты нужны. И не из праздного любопытства, а так, чтобы реально помогало управлению.

Насколько мне известно, некоторые интеграторы ведут работу по связыванию показателей документооборота с KPI. Ноу -хау тут может быть как раз в области менеджмента, потому что важнее всего правильно поставить задачу — что и как считать.

И еще плохие новости. Чем больше данных, тем больше риск их кражи и неправомерного использования. Насколько я понимаю, дело не собственно в объеме данных, а в том, что в их обработке становится занято все больше и больше людей, а мы-то уж знаем, что в модели нарушителя самое слабое звено пресловутый «человеческий фактор». Риск возрос не только потому что стало больше жуликов, но потому что развелось много чайников безалаберно относящихся к информационной безопасности. Что позволяет жить вольготно жуликам.

Другая популярная страшилка — призрак «Большого Брата». Верить в это и бояться или нет — личное дело каждого. Но стоит быть готовым, к тому, что о вашей личной жизни во всех подробностях скоро будут знать не только офицеры ФСБ (им-то уж положено), но так же почти любой грамотный data scientist или knowledge worker.

И снова вопрос — причем здесь ECM? – Да при том, что WCM (web content management), это тоже часть ECM. Может документооборота эта тема и меньше касается, но отрасли в целом — вполне.

Предлагается ли нам какой-то выход? Конечно, иначе все было бы слишком мрачно. Парадоксально, но автор видит выход в том, чтоб обеспечить большую доступность данных и прозрачность в о многих сферах. И я придерживаюсь того же мнения. Глупо тратить силы и ресурсы на охрану ворот, когда забор дырявый. И охранять секреты, которые всем известны. Будем учиться жить открыто. (Представьте, что мы все в одном Доме-2 и расслабьтесь :)

Вторая половина этой задачи — действительно повышать информационную безопасность там, где это реально требуется. Увы, мой собственный опыт говорит о том, что безопасники и документооборотчики очень слабо понимают друг друга. Я сам несколько лет был, так сказать, на стыке этих миров.
Предстоит еще большая работа. Кстати, тоже вполне наукоемкая тема. Возьмем хотя бы тот факт, что ни у ФСБ ни у ФСТЭК нет документов, определяющих функциональные требования к безопасности СЭД. Все проверки можно выполнить только по защите от НСД и на отсутствие НДВ (несанкционированный доступ и недекларированные возможности). Но при этом дыры преспокойно могут быть на уровне функциональности, поскольку регламентирующего документа на эту тему нет — чего именно СЭД не должна позволять делать, чтобы соответствовать своему назначению?

ОК, по первой причине из восьми закругляемся.
Итак, предстоящее резкое возрастание объемов данных в значительной мере повлияет на развитие отрасли ECM, а именно:
Потребуется создание новых способов организации и визуализации информации.
Произойдет переход к использованию ЕСМ (и СЭД в частности) в режиме SaaS.
Данные будут хранится в ЦОДах, потребуется развитие коммуникационных технологий.
Необходимы более изощренные методы анализа данных в сфере ECM.
Будут разрабатываться новые бизнес-подходы, чтобы обеспечить реальное использование данных из ECM-систем.
Произойдут социальные, психологические и затем уже правовые изменения в строну больше открытости.
Требования информационной безопасности станут более предметно-ориентированными (и более строгими, там, где это необходимо.)

Ну, осталось рассмотреть еще семь причин, побуждающих срочно заняться стратегией ECM.

10 комментариев:

  1. Вы, Станислав, прямо, как с другой планеты - "информация, информация", да кому она сдалась эта Ваша информация? Она дитя малое, каши просит? Тоже мне проблема. И ни слова про контроль исполнения. Ведь все очень просто - приказать и наказать.

    ОтветитьУдалить
  2. Если в контуре СЭД - возможно. Но есть жизнь и за периметром.

    ОтветитьУдалить
  3. Про контроль - отдельно, в надлежащем месте. Пока первый тезис - информации (документов, данных, видео) - становится больше. Возможно на порядки. Существующие системы не готовы к такому росту.

    Если обозначить сферу наших интресов как "документооборот", то действительно все расширения в сторону социальных сетей, видео-контента и пр. нам ни к чему. Наше дело тогда - входящие исходящие, контроль исполнения.

    Но давайте и вывеску сменим в этом случае. ECM-Club будет слишком пафосно для этого.

    ОтветитьУдалить
  4. Я уверен, что сарказм и пессимизм Александра имеют сугубо временный и локальный характер :)

    ОтветитьУдалить
  5. Станислав опеределил меня: я хотел затронуть этоу же тему. 3-4 года назад мы в России не признавали термин ECM как таковой, как чуждый нашему национальному... ну, скажем, достоинству. Типа "у советских - своя гордость". Потом, вроде как, признали и стали даже использовать в разного рода статья-речах.

    Но по сути, как мыслили категориями ОРД, так и продолжаем мыслить.
    При это до сих не сформулировав, что мы понимаем под СЭД.
    Насчет смены вывески - полностью согласен. Правда, сменить ее непросто (адрес сложно поменять).

    Но вот чего, мне кажется, СЭД отласль не понимает: если она не будет заниматься ECM, то ею (ECM) займутся другие.

    ОтветитьУдалить
  6. Мне кажется, пора начинать разрабатывать как отдельное направление "Удаление избыточных данных" (для любителей аббревиатур - УИД). Нужны интеллектуальные алгоритмы определения избыточных данных - не дедупликации, а именно выявления лишнего - того, что не нужно хранить. Нужно пересматривать и официальные требования к сохранению архивов предприятий. А главное - нужно научиться понимать, что из хранящихся данных может принести пользу в дальнейшем и на каком уровне детализации эти данные будут использоваться, иначе не хватит никаких ЦОДов.

    ОтветитьУдалить
  7. Но вот чего, мне кажется, СЭД отрасль не понимает: если она не будет заниматься ECM, то ею (ECM) займутся другие.

    Вот ты всегда так, Василий Иванович, грозишься, грозишься...

    ОтветитьУдалить
  8. Разговоры об информационном потопе - очень старая сказка (http://www.pcmag.ru/issues/detail.php?ID=35280). В устах западных специалистов - это такая же сто раз пережеванная маркетинговая жвачка, как "контроль исполнения" - у российских. И у всех, как говорится, воз и ныне там. Разработчики мобильных телефонов и разных гаджетов не рыдали - "ой-ой, как человеку одиноко и нечем занять себя в метро". Продукция продавалась на ура. Миллиардам. Только покажи. А пропаганда так ли, иначе ли называемых информационных наручников - дело неблагодарное. Но нужное.

    Неудобные вопросы - не так ли?...

    ОтветитьУдалить
  9. Направление УИД давно разработано и существует в множестве идустриальных платформенных ЕСМ-продуктов, например, в известном Ретеншен Полиси Сервисиз, который продолжает развиваться очень активно от автоматического определения политик хранения в зависимости от бизнес атрибутов и внешних\внутренних событий к контекстному анализу массивов и выдаче запросов в автоматическом режиме на подтверждение целесобразности хранения.

    ОтветитьУдалить
  10. yu-kurochkin привлек внимание к очень важному вопросу - информационному загрязнению. Я писал в одной из статей, что мы имеем здесь дело с аналогом экологических проблем в инфосфере. Большая часть сохраняемого контента (хоть персонального, хоть корпоративного) - мусор. Он (в будущем) может принести пользу в редких случаях, а затраты на хранение и затруднения с его разгребанием при поиске нужной информации гарантированно создает уже сейчас.

    Интересно, что как и в экосфере, информационный мусор - потенциальный источник огромных богатств, вопрос в технологиях его утилизации. Думаю, в будущем старую информацию можно будет за деньги сдавать каким-нибудь новым Гуглам и Яндексам - они будут перерабатывать ее в новые бизнес-идеи и т.п. Это имеет известное отношение к вопросу о науке.

    ОтветитьУдалить

Примечание. Отправлять комментарии могут только участники этого блога.