Грегор Айш: "Журналістам треба перестати боятися хакерів"
Інтерактивні візуалізації та інфографіка набирають все більшої популярності в ЗМІ, а журналісти починають розкопувати цікаві факти в статистиках і візуалізувати їх самостійно або за допомогою програмістів. Цей тренд отримав назву "журналістика даних". Що потрібно знати початківцям-журналістам, які працюють з даними, як їм співпрацювати з програмістами і чи потрібно журналістам самим вміти програмувати?
Про це в інтерв'ю DW Akademie розповів німецький фахівець з візуалізації даних Грегор Айш (Gregor Aisch). Грегор працював над створенням платформи Datawrapper, яка дозволяє журналістам публікувати прості інтерактивні графіки. Він також розробляє візуалізації для таких великих медіаорганізацій, як Deutsche Welle і Zeit Online.
"Журналістам пора перестати боятися хакерів", - каже Грегор Айш. "Звучить смішно, але багато хто до цих пір представляють хакерів як злочинців, які проводять дні і ночі за написанням вірусів і зломами систем електронного захисту банків і урядів".
- Грегор, ти за освітою не журналіст, а саме технічний фахівець. Як тобі подобається працювати з журналістами?
- Дуже подобається! Вони зазвичай дуже чітко розуміють предмет свого журналістського розслідування, і у них безліч цікавих ідей про те, як піднести історію. У відділах піару і маркетингу такий підхід нечасто побачиш.
- Що журналістам необхідно знати, щоб розповідати цікаві історії, засновані на даних?
- Потрібно розуміти масштаб і уявляти собі тимчасові витрати на інтерактивні візуалізації в мережі. Адже створення інтерактивних візуалізацій дуже схоже на розробку програмного забезпечення, потрібно розуміти, чого чекати, і вміти управляти ресурсами, щоб отримати результат в потрібний термін. Інакше доведеться пережити масу розчарувань.
- Що журналістам важливо пам'ятати при спільній роботі з програмістами?
- Така робота схожа з роботою з управління проектами. Важливо перебувати в постійному діалозі, особливо на початку проекту. Часто буває складно дійти загального розуміння того, яким має бути кінцевий продукт. Тут дуже допомагають ескізи від руки.
- А самі журналісти повинні вміти програмувати?
- Для початку журналістам пора перестати боятися так званих хакерів. Звучить смішно, але багато хто до цих пір представляють хакерів як злочинців, які проводять дні і ночі за написанням вірусів і зломами систем електронного захисту банків і урядів. Регулярні зустрічі типу Hacks/Hackers у Берліні допомагають навести мости між журналістами і хакерами, тобто програмістами.
Для щоденної роботи з масивами даних раджу отримати базові навички написання скриптів. Спочатку буде складно, але через пару днів ви самі здивуєтеся, скільки всього вже можете. Написання пари рядків коду часто допомагає позбутися від нудного повторення простих завдань. Особливо в онлайн-журналістиці економне використання часу вкрай важливо, адже там постійно є дедлайни для здачі матеріалу.
До того ж, журналістам і самим корисно розуміти в загальних рисах, що можна зробити і скільки часу на це приблизно піде. Звичайно, журналіст не зобов'язаний вміти створювати інтерактивні візуалізації з нуля. Щоб навчитися цьому, знадобиться кілька років. Але треба розуміти, що в принципі здійснимо, а що ні.
- Які інструменти для візуалізації можна використовувати, якщо не вмієш програмувати?
- Excel, LibreOffice, Tableau Public, ManyEyes, Datawrapper, QuantumGIS - всі ці інструменти дозволяють швидко створювати якісні візуалізації даних і карти. Ці програми можна або безкоштовно завантажити, або використовувати веб-версію, часто вони вже встановлені на комп'ютері. Так що почати можна просто і без зайвих витрат. Звичайно, тимчасових витрат на вивчення нових програм не уникнути.
- З чого почати журналістам, які цікавляться журналістикою даних?
- Для початку раджу ознайомитися з однією з програм по роботі з електронними таблицями. Більшість історій, заснованих на даних, починаються з простої таблиці, так що важливо вміти виконувати найпростіші операції, наприклад, розділяти кількість випадків з летальним результатом при аваріях на загальну кількість аварій у всіх регіонах країни. Якщо вам не подобається інтерфейс в Excel, раджу звернути увагу на безкоштовну альтернативу LibreOffice Calc. Це дуже проста і потужна програма.
- Зараз в інтернеті популярні найрізноманітніші візуалізації. Які помилки найчастіше в них відбуваються?
- По-перше, я обожнюю візуалізації, так що чим частіше вони використовуються, тим краще. Одна з найгірших помилок, які мені доводилося бачити, - це неправильне розміщення підписів до графіків. Якщо ви тільки й робите, що прямуєте підказкам програми, напевно щось буде не так.
- Назви, будь ласка, свої улюблені візуалізації.
- Ось цей приклад від New York Times показує діаграму розсіяння (scatterplot), на горизонтальній осі ми бачимо показники за випусками з коледжу для чорних, іспаномовних і азіатських студентів, на вертикальній осі - показники по студентам-першокурсникам. На графіку чітко видно, що в кращих вузах з високим відсотком студентів, які випустилися, рівень чорних студентів набагато нижче. Наприклад, в Гарвардському університеті на перший курс зараховано тільки 8,8% чорних студентів, при цьому до випуску в цьому університеті доходять 97% студентів.
Ця тема в США зараз дуже актуальна, тому що все більше штатів відмовляються від планів з "позитивної дискримінації". Починаючи з часів президентів США Кеннеді і Джонсона з 60-х роках, ці плани повинні були гарантувати певні квоти по студентах різних расових приналежностей для університетів. Зараз все більше республіканських штатів збираються скасувати ці плани, тому що вважають квоти незаконними.
У подальшій інтерактивної візуалізації редкція NYT показала результати попередньої заборони у таких штатах, як Каліфорнія. Вони порівняли процентне співвідношення першокурсників різних рас з відсотком жителів, що належать до цієї раси, вік яких порівнянний з віком студентів. Помітно, що особливо в Каліфорнії заборона плану з "позитивної дискримінації" супроводжувався серйозним зниженням надходжень до коледжу іспаномовного і чорного населення.
Наведу останній приклад. Це приголомшлива візуалізація, створена співробітниками New York Times Метью Блоч (Matthew Bloch) і Ханною Феірфілд (Hannah Fairfield). За допомогою діаграм Венна автори показують перетин різних хвороб літніх людей. У 9% з 700 000 жителів центрів допомоги виявлено поєднання хвороб серця, високого тиску і хвороби Альцгеймера, всі разом лікувати дуже складно.
- Всі наведені приклади - з газети New York Times. Чим вони кращі за інших?
- Аманда Кокс (Amanda Cox), графічний редактор NYT, одного разу сказала приблизно таке: "Треба взяти читача за руку і провести його через всю інфографіку". Без анотацій та пояснень будь-яка інфографіка - це всього лише спроба сказати читачам: ось картинки, розбирайтеся, як хочете. Ще NYT правильно підходить до підбору команди. Вони наймають графічних редакторів, картографів, 3D-аніматорів і розробників інтерактивних програм - і всі вони працюють разом. У багатьох редакціях в Німеччині графічний відділ для друкованої версії або для телеканалу досі відділений від відділу графіки онлайн-редакції. Це сильно ускладнює процес створення якісних інтерактивних візуалізацій.
- Які ресурси з візуалізації даних ти радиш читати регулярно?
- Раджу переглядати ось цей список візуалізацій, блог Альберто Кайро, ось цей ресурс від Mozilla Open News, а ще це зібрання кодів для різних візуалізацій і сайт "Informations Aesthetics".
- Які книги порадиш журналістам, які хочуть навчитися створювати візуалізації?
- The Wall Street Journal Guide to Information Graphics, The Functional Art: An introduction to information graphics and visualization і Data Visualization: A successful design process.
Інтерв'ю вела Наталія Карбасова
Help us be even more cool!