2013-04-29_092909_1367213448.jpg.600x450_q85 (1)

Готовы ли мы к журналистике данных?

     -     Авг 5th, 2013   -     Журналистика данных, Открытые данные   -     1 Comment   -    

В последнее время как основное направление развития современных медиа все чаще упоминается журналистика данных. О ней пишут статьи, ей начинают учить, появляются первые книги и пособия и, конечно, появилось немало практиков, делящихся собственным опытом.

Россия здесь не исключение, о журналистике данных писали и пишут, наконец-то стали происходить мероприятия, где собираются журналисты и те, кто заинтересован и думаюет, не заняться ли журналистикой данных в самое ближайшее время.

Но действительно ли мы понимаем, что это такое? Не надо ли вначале разобраться, откуда и почему взялась журналистика данных и что надо уметь, чтобы успешно её применять на практике.

В Data Journalsm Handbook в разделе “Что такое журналистика данных” есть следующее определение:

What makes data journalism different to the rest of journalism? Perhaps it is the new possibilities that open up when you combine the traditional ‘nose for news’ and ability to tell a compelling story, with the sheer scale and range of digital information now available.

В переводе это звучит так:

Что отличает журналистику данных от остальной журналистики? Возможно это новые возможности того что открывается при использовании традиционного «нюха на новости» и способности рассказать захватывающую историю на большом масштабе и пространстве цифровой информации (данных), доступной сейчас.

Это довольно точное определение главное, в котором - история и данные. Чтобы понять его важно понять изменения последних лет.

Потеря фронтира

В течение 90-х готов 20 столетия и двухтысячных Интернет слишком часто упоминался как огромное неосвоенное и неурегулированное пространство больших возможностей и большого риска. Степень свободы слова, выражения и предпринимательства здесь была несравненно выше, чем в реальной физической окружающей нас жизни. Многочисленные мемы вроде «Это Интернет детка, здесь могут и послать» — как нельзя более точно отражают состояние Всемирной сети и отношение к ней огромного числа людей.

Этот фронтир порождал многочисленные устойчивые мифы. Мне регулярно доводится слышать и по сей день, что «Интернет — это гигантская свалка информации» или что «Человечество столкнулось с огромным информационным цунами и пока не знает, как с ним бороться». Или о том, что анонимность в Интернете возможна всегда, а все ограничения бессмысленны и не работают.

Да, безусловно, много лет Интернет был «свалкой» из огромного числа сайтов, веб-страниц, разрозненных материалов и многого другого, но как раз именно в последние годы всё начало меняться и меняться довольно стремительно.

Приход Государства

Во-первых, в сеть пришло государство. Нет не только наше российское государство, но все Государства как крупнейшие игроки и регуляторы. Пришли, устанавливая свои правила, законы и требования. У государств было и есть много причин, главные из которых — это контроль и соответствие ожиданиям.

И о том, и о том стоит проговорить подробнее. Государство всегда пытается добиться контроля за всем, что касается не подпадающих под его регулирование общественных отношений. Это может подаваться под самыми разными обоснованиями — борьбой с мошенничеством, с терроризмом, с уголовными преступлениями, защита прав потребителей и многое другое. Но суть везде одна — государства пытаются сохранить монополию на власть и на её распределение. Следствием этого оказывается то, что Интернет, ранее регулируемый слабо или плохо, теперь подвергается очень активным попыткам различных стран установить свои правила и требования. Однако контроль — это  то, о чем сейчас пишут все больше. Он относится не столько к журналистике данных, сколько к среде, в которой мы находимся.

Более важная история с соответствием государства ожиданиям граждан. С развитием Интернета современные государства практически все находятся под постоянным давлением по той причине, что удобства, которые приносит гражданам получение различных сервисов и возможностей через Интернет резко контрастируют с архаичным устройством современного государственного управления.

Например, для того чтобы банку начать предоставлять услугу работы со счетами через банк клиент ему достаточно сформировать соответствующую проектную команду у себя внутри и в короткие сроки реализовать такой проект и дать гражданам новый сервис.

Для того чтобы государственной структуре предоставить какую-либо государственную услугу потребуются десятки нормативных документов, совместная работа многих служб, огромные объемы расходов и многое другое. И даже после этого не факт что граждане как потребители получат услуги сравнимого качества с тем, что делают коммерческие компании.

При том, что государства сохраняют монополию на значительную часть нашей жизни — на принудительное образование, на насилие, на пенсионное страхование, на всю ту информацию, которую государство собирало все эти годы, тем не менее, именно сейчас конкуренция качества стала как никогда острой и актуальной. И это вызвано не только тем, что качество коммерческих услуг растет, Интернет также позволяет наглядно увидеть, как это происходит в других странах, качество управления ТАМ и ЗДЕСЬ видно слишком многим, и собственными глазами, и через прессу.

Всё это привело к тому, что в последние годы в большинстве развитых стран многочисленные проекты по автоматизации работы госслужащих, проекты в области Электронного правительства и попытки государств привести внутренние процессы к лучшему качеству и использованию современных инструментов, породили огромное количество государственных информационных систем ведения реестров, каталогов, баз данных и иной порождаемой органами власти информации.

Именно благодаря этому в последние годы получило такое развитие движение в сторону открытости данных (open data movement) и государства, в ответ на спрос граждан, стали создавать порталы открытых данных и раскрывать накопленные ранее и создаваемые сейчас базы данных для всеобщего использования.

Эти данные активно используются бизнесом, активистами, НКО и, конечно же, журналистами. Ведь то, что ранее можно было собрать лишь вручную, перебирая сотни и тысячи документов, — теперь удобным образом доступно и пригодно для быстрого использования.

Порядок выгоден

Несмотря на то что Интернет огромен и, безусловно, в нем присутствует чуть ли не бесконечные возможности для поиска информации по любой интересующей теме, тем не менее, его развитие показало что в нем есть вполне чёткие лидеры и концентраторы внимания. Поисковые системы, такие как Google, Яндекс, Bing, Yahoo, такие общественные проекты как Википедия, OpenStreetMap и многие другие.

Все это привело к появлению многочисленных инициатив по объединению и интеграции разрозненной информации и баз данных. К таким попыткам можно отнести, и такую инициативу поисковых систем как Schema.org, где они предлагают публиковать данные в специальных форматах так чтобы поисковики понимали что на веб-странице находится. Туда же можно отнести и инициативы Semantic Web и Linked Data – идея, пришедшая из академической среды, заключающаяся в приведении всех данных к общим форматам и специальном способе их публикации – так, чтобы специальными программами можно было бы извлекать информацию сразу из множества источников.

Другое явление — это активное развитие интеграции Интернет сервисов. Наличие веб-сервисов, специальных машинных интерфейсов позволяющих разработчикам интегрироваться с тем или иным сервисом, становится все более нормой. Огромная коллекция веб-сервисов собрана на таких ресурсах как ProgrammableWeb и других.

В результате всё больше самых разных источников хорошо структурированных данных и сервисов на их основе доступны для всех желающих. Они используются для бизнеса, для личного любопытства и, конечно же, для исследований и расследований.

Помимо той части Интернета, которая так и остается «свалкой информации» — появились доступные базы данных, позволяющие значительно работать с данными. Все, что осталось добавить к ним — это людей, способных придумать на их основе то, что было бы востребовано другими.

Одного только слова недостаточно

Практически за всё время существования журналистики как профессии главным её оружием было слово. Способность донести до читателя наиболее доходчивым или, наоборот, эмоциональным образом мысль автора. Журналисты регулярно оттачивают мастерство, пишут проникновенные тексты вызывающие справедливое негодование, сопереживание или иные яркие эмоции за счет лишь правильных слов сложенных воедино.

Других способов кроме этого, ну и быть может картинок/карикатур/плакатов, и того что мы ныне называем инфографикой не существовало до появления Интернета. Журналистика была словесной игрой и на протяжении если не сотен, то точно десятков лет.

Но всё это в прошлом, потому что Интернет как цунами догнал все печатные СМИ и изменил самое главное, что только можно было изменить — монополию журналистов на доступ к широкому читателю. Если еще пару десятков лет для того чтобы владеть умами людей необходимо было обладать недюжим писательским талантом, или же быть журналистом широко читаемых изданий (или быть политиком), то сейчас каждый пользователь сети может открыть свой блог и начать писать там всё что только ему вздумается.

Распространение этой информации через социальные сети, взрывной выход обывательской повседневности онлайн привел к тому, что редкое СМИ сейчас обладает добытой эксклюзивной информацией — гораздо чаще журналисты, на равных со всеми остальными, вылавливают крупицы интересного из огромного потока того, о чем пишут люди, не имеющие к журналистике никакого отношения.

И, хотя всё время существования Интернета число читателей онлайн СМИ росло, но было это вызвано тем, что число пользователей Интернета росло точно также. Сейчас же, когда скорость роста числа пользователей сети снижается — неизбежно для повышения популярности СМИ необходимо искать новые форматы донесения информации до читателя так чтобы это выделяло их и привязывало именно к ним. Этот желания стать «новыми медиа» сейчас состоит из многих путей — гражданская журналистика, гиперлокальность, журналистика данных и многое другое.

Журналистика данных как она есть

Вернемся к определению журналистики данных. Это данные и история, вместе поданные как единое целое и предоставляемые через современные интерфейсы. Чтобы понять, что такое журналистика данных лучше всего начать с примеров.

Предположим событие — принимается бюджет страны на 2013 год. У Вас на руках материалы по тому, какой объем бюджета, по каким статьям и как он изменился по сравнению с прошлым годом. Классическая журналистика — это упаковать всё это в текст. В нескольких форматов — от сухого до очень эмоционального описать, что принимается и что изменилось. Журналистика же данных в том чтобы рассмотреть бюджет как базу данных. Одна картинка может заменить тысячу слов и если нарисовать структуру бюджета, то и текст будет куда понятнее. Так и делают некоторые издания, например, по бюджету 2013. Иначе говоря — самое первое приближение к журналистике данных — это инфографика. Упаковка данных в графики и наглядное их представление. Что, впрочем, неверно наоборот — не всякая инфографика относится к журналистике данных. Инфографика может содержать любые факты — как похожие на данные, так и факты сами по себе.

Однако и инфографика — это лишь один из вариантов. Будет справедливо сказать что инфографика — это не такой уж шаг вперед от печатных изданий и главное отличие в её онлайн воплощении будет лишь дешевизна представления информации в цвете.

Современное представление того же бюджета в в журналистике данных — это построение графиков и интерактив, как это сделано, к примеру, в статье Guardian The Budget visualised: 8 key charts to tell you what happened  где приводится 8 графиков максимально наглядно демонстрирующих различные аспекты бюджета Великобритании — соотношение налогов и расходов с 1978 года по наше время, ВВП, государственный долг, уровень дефицита бюджета, инфляция и многое другое. А также Budget 2013: the 13 charts you need to know - 13 графиков показывающие другие стороны экономики страны.

Другой пример. Катастрофы — цунами, тайфуны, наводнения и землетрясения. Когда ураган Sandy атаковал восточное побережье США — практически сразу же американские СМИ создали около десятка проектов помогающих потерпевшим и дающие информацию в реальном времени.

WNYC создали интерактивную карту мониторинга уровня воды, а Providence Journal собрали и визуализировали данные по отключениям электричества.

Многочисленные похожие проекты появлялись после сокрушительного землетрясения на Гаити, катастрофы на Фукусиме-2 и многом и многом другом.

И именно это и есть журналистика данных, мы можем описать её как

- эмоционально нейтральную — цифры и их визуализация вместо красивых слов;

- технологичную — значительная часть проектов по журналистике данных требуют программиста или целой ИТ-команды на то, чтобы их реализовать в короткие сроки;

- требующую подходящую среду — журналистика данных работает там, где данные есть и есть возможность их быстро получить и визуализировать.

Почти всегда журналистика данных претендует на нейтральность. Благодаря ей подают факты и цифры предоставляя читателю возможность для самостоятельной интерпретации. Почти всегда журналистика данных требует слаженной ИТ-команды, потому что подготовка статей требует оперативной работы, как и сбор данных и их визуализация.

И она, безусловно, отличается от журналистского расследования.

Журналистское расследование = журналистика данных

Упоминая журналистики данных невозможно не упомянуть и журналистские расследования. Расследования — это давний жанр, в котором журналист уделяет много времени тщательному и глубокому поиску фактов на основе которых готовится материал. Причем если ранее журналистские расследования требовали очень серьезных усилий — интервью со свидетелями, запросы официальной информации, поиск ключевых документов и многое другое, то с появлением Интернета и журналистские расследования изменились — слишком много фактов стали доступны онлайн.

Предположим, какая-либо компания выигрывает государственный тендер и заключает контракт, а сам контракт выглядит странно, например, в нем занижены сроки или завышена цена. Как действовать журналисту, чтобы провести расследование?

Журналист может:

- выявить все контракты данной организации с этим заказчиком и вообще все их контракты

- выяснить информацию об организации из ЕГРЮЛ — кто директор, где находятся, кто учредители

- через социальные сети (Facebook, Odnoklassniki, Vkontakte) проверить личную аффилированность поставщика и заказчика (по учредителям, гендиректорам и тд);

- по базам контрактов государственным и не только поискать похожие и определить обоснованность цены;

А также многое другое.

Причем можно обратить внимание, что в данном случае работа журналиста-исследователя более чем на 50% времени состоит из работы с базами данных, извлечения из них информации и её интерпретации.

Главное же отличие от журналистики данных в том, чем является результат расследования.

Классический результат — это текст. Тщательно снабженный фактами, обоснованный, подкрепленный ссылками к первоисточникам, описанием того как расследование проводилось и что же выяснилось в итоге. Хорошо проведенное расследование, в своей конечной цели, должно быть текстом, который приводит к отставкам, уголовным или административным делам, расследованиям правоохранительных органов и серьезному общественному вниманию к пойманной проблеме.

Однако текст — это не журналистика данных. Текст — это то что получается после всех интерпретаций журналистом не оставляя возможности читателю делать собственные выводы более-менее обоснованно. По этой причине журналистика данных и журналистские расследования хотя и могут пересекаться, но вовсе не идентичны. Их пересечение возникает лишь тогда, когда журналист хочет донести результаты собственного расследования максимально наглядно.

В этом случае расследование должно дополнятся всеми теми базами, таблицами и первичными документами, которые журналист нашел в процессе своей работы над материалом, а также наглядная их визуализация. Иначе говоря журналистские расследования становятся журналистикой данных только после того как они подкреплены технологичной визуализацией собранных данных.

Главное люди

Главные возможности журналистики данных, донесение информации наглядным и технологичным образом, является и её же ограничением. Современных журналистов не учат не то что программированию, но и точным наукам в принципе, навыкам работы с информацией и искусным владением, хотя бы, на уровне Microsoft Excel.

Это приводит к тому, что журналистика данных оказывается, либо уделом _не журналистов, а различных отраслевых экспертов-блогеров, либо единиц журналистов которых можно пересчитать по пальцам одной руки.

Проще привести в пример блогеров.

- Егор Сусин (ЖЖ ник - ugfx) регулярно пишет заметки о состоянии макроэкономических рынков подкрепляя каждый пост графиками на основе различных финансовых открытых данных.

- Сергей Шпилькин (жж ник - podmoskovnik) — физик по профессии, во время выборов в Государственную думу сделал серию публикаций на основе открытых данных о выборах. А далее — и статьи в таких изданиях как «Троицкий вариант».

Сильная команда есть в РИА «Новостях», одного из немногих изданий, обладающих достаточными ресурсами для постоянной ИТ-команды, многочисленные публикации в формате журналистики данных были в «Форбсе», «Слоне», «Московских новостях», в самом «Полит.ру» и во многих других изданиях.

С той лишь оговоркой, что чаще всего именно журналистикой данных это не называлось. До нас долетел тренд на создание новых медиа на основе данных, но системный подход в них требует еще и переосмысления бизнес модели. Понимания что именно журналистика данных может принести для СМИ. Взвесить все риски и возможности.

Взвесить риски

Главные риски в журналистике данных — это дефицит квалифицированных кадров и квалифицированных читателей. Про квалифицированные кадры я упоминал ранее — специалистов очень мало. Идеальный вариант когда есть журналист способный придумать историю и ИТ-команда способная её воплотить онлайн — это очень дорогой формат не каждому изданию под силу, а найти своего «универсального солдата» очень непросто. Надо или журналиста научить работать с данными, или найти специалиста по данным с журналисткой склонностью доносить истории. И то, и то, задача нелегкая.

Но и дефицит кадров не столь критичен как дефицит квалифицированного читателя. Журналистика данных ровно противоположная эмоциональной журналистике («эмо-журналистике») и сухая подача фактов далеко не всегда способна создать сравнимое число просмотров, лайков, репостов и комментариев. Журналистика данных ориентирована на аудиторию склонную к собственному мнению и рефлекции, а таких людей, как все мы понимаем, далеко не большинство не только в нашей стране.

Главное — возможности

Однако, несмотря на все недостатки, есть несколько причин того, почему журналистикой данных необходимо заниматься и лучше начинать это делать прямо сейчас.

Интерактивные инструменты и визуализации, при хорошем исполнении, позволяют не просто привлечь читателя к однократному просмотру статьи, но возвращаться с завидной регулярностью для уточнения информации, сравнения и сопоставления.

Для изданий ориентированных на профессиональную аудиторию — журналистика данных дает значительные возможности привлекать читателей и обеспечивать их лояльность. Сильная предметная аналитика, подкрепленная данными и их визуализацией, позволяет закрепить и поддерживать профессиональный уровень издания, создать дополнительную ценность и многое другое. Визуализация бюджетов — это ровно такой случай, для профессиональной аудитории подобный формат весьма востребован.

Другая важная сторона — это кризисные долгие события, где одного новостного формата подачи недостаточно. Не менее важно представление информации из других источников, цифры, статистика, наложение на карты и многое другое. Это требует высокой скорости реакции от издания, способности быстро создать формат, подходящий под подобное событие. Но и позволяет получить огромное число читателей приходящих за актуальной информацией.

Примерами таких проектов являются проекты по мониторингу последствий урагана Сэнди, землетрясений, цунами и многое другое. Это столь актуально, что подобные проекты создают, в том числе, такие гиганты как Google в формате Google Crisis Response

Одно можно сказать с полной уверенностью. Журналистика данных сейчас является одним из мировых трендов развития журналистики в целом и одной из лошадок, на которых современные СМИ попытаются найти себя в современном мире. Я искренне надеюсь, что в России её будет как можно больше, потому что именно журналистика данных является одним из важных потребителей открытых государственных данных, и чем громче будут звучать голоса, в том числе и журналистов, об открытости государства — тем больше шансов, что этой открытости нам удастся достичь при нашей жизни.