Текст книги "Искусственный интеллект"
Автор книги: Мередит Бруссард
Жанр: Компьютеры: прочее, Компьютеры
Возрастные ограничения: +12
сообщить о неприемлемом содержимом
Текущая страница: 4 (всего у книги 17 страниц) [доступный отрывок для чтения: 6 страниц]
4
Здравствуй, журналистика данных
Мы с вами – свидетели удивительной эпохи, когда компьютеры внедряются в каждую область человеческой жизни. Сегодня социальные науки, биология, химия компьютеризируются, появилась цифровая гуманитаристика; художники используют язык программирования Processing при создании объектов мультимедиаискусства; 3D-печать расширяет возможности скульпторов. Этот стремительный прогресс будоражит воображение. Однако по мере того, как цифровые технологии все больше вторгаются в жизнь, меняются люди. И тот факт, что государственные данные открыты, совсем не означает, что коррупции больше нет. А экономика свободного заработка, появившаяся благодаря технологиям, связана с теми же проблемами, что и рынок труда в начале индустриальной эпохи. Традиционно журналисты анализировали подобные проблемы, чтобы затем стимулировать положительные социальные изменения. В технологическом мире практика анализа в рамках журналистских расследований стала высокотехнологичной.
Многие из тех, кто пытается раздвинуть границы технологических возможностей в журналистике, называют себя журналистами данных. Журналистика данных – это обобщающий термин. Для некоторых она подразумевает создание визуализаций. Например, Аманда Кокс – редактор раздела «Развязка» (The Upshot) в The New York Times – мастер всех типов визуальной журналистики. Вспомним, например, историю 2012 г. «Маленькие звенья одной инфляции» (All Inflation’s Little Parts), благодаря которой Кокс получила премию Американской статистической ассоциации за превосходный анализ. Данные, на которых основывалось исследование, она взяла из индекса потребительских цен и использовала для анализа инфляции. На графике представлен большой круг, разбитый на цветные мозаичные заголовки. Размер каждого соответствует проценту расходов американцев.
Крупный блок, «бензин», составляет 5,2 % расходов. Бензин – это часть категории «транспорт», расход на который у рядового жителя страны составляет 18 %. Форма поменьше – это расходы на покупку яиц, они входят в категорию «питание и напитки», на которую тратится около 15 %. «Высокие цены на нефть и засуха в Австралии – среди прочих факторов – способствовали рекордной с 1990-х гг. скорости роста цен, – пишет Кокс. – Высокий спрос на яйца среди европейцев также повлиял на ценообразование в этой категории»[14]14
Cox, Bloch, and Carter, “All of Inflation’s Little Parts.”
[Закрыть]. Сама статья и сопровождающие ее графики открывают окно в новый удивительный мир, где жителей разных городов соединяет сложная сеть торговли. Неужели яйца – глобальный феномен? Ну разумеется! Отдельные страны уже сами не производят продукты питания. Еда – это глобальный рынок. На западе Австралии находится пояс пшеницы. Согласно отчету Департамента сельского хозяйства Австралии, в 2010–2011 гг. экспорт пшеницы составил $27,1 млрд. А засуха в том регионе привела к снижению экспорта пшеницы. Корм для птицеводческих фабрик США в основном состоит из злаков. Кукуруза предпочтительнее, но если она слишком дорогая, то в ход идет пшеница. Соответственно, меньшее количество доступной в мире пшеницы приводит к росту цен, из-за которого птицефабрикам приходится платить за пшеницу больше либо покупать еще более дорогую кукурузу. А поскольку фермеры вынуждены платить больше за корм, то эти расходы они включают в стоимость яиц. И это повышение ощутимо отражается на ценах на продукцию в супермаркетах. Так данные помогают увидеть, как засуха в Австралии привела к росту цен на яйца в Северной Америке, ощутить глобализацию, всеобщую взаимозависимость и экологические последствия изменений климата. Чтобы создать удивительный визуальный цифровой артефакт, который одновременно информирует и восхищает, Кокс прибегает к сторителлингу и своим знаниям о том, как сложные системы воплощаются в окружающем мире, а также использует технологические навыки и острое журналистское чутье.
Иные журналисты собирают и анализируют данные самостоятельно. В 2015 г. Atlanta Journal-Constitution (AJC) собрал данные о случаях сексуального абьюза со стороны докторов по отношению к пациентам. ACJ обнаружил, что в Джорджии двум третям докторов, понесшим наказание за сексуальное противоправное поведение с пациентами, разрешили вновь заниматься практикой. И этих данных было более чем достаточно для статьи, однако репортер задалась вопросом, насколько необычен случай в Джорджии. Тогда история превратилась в групповое расследование. Журналисты собрали данные со всей Америки и проанализировали больше сотни тысяч ведомственных приказов, связанных с дисциплинарными нарушениями докторов, в период с 1999 по 2015 г. Результаты шокировали. По всей стране докторам, обвиненным в абьюзивных действиях по отношению к пациентам, разрешали вернуться к практике. Некоторые случаи были просто ужасающими. Эрл Брэдли, педиатр, накачивал детей транквилизаторами при помощи конфет, затем растлевал их и записывал все на видео. В 2010 г. ему было предъявлено 471 обвинение в изнасиловании и растлении. Суд вынес приговор – 14 пожизненных без права на досрочное освобождение. К счастью, расследование AJC подняло эту проблему и привело к позитивным изменениям в этой области[15]15
Hart, Robbins, and Teegardin, “How the Doctors & Sex Abuse Project Came About.”
[Закрыть].
Штат Флорида. Дата-журналисты Sun Sentinel остановились на обочине шоссе и заметили приближающиеся полицейские машины. Позже они, запросив данные с транспондеров и из пунктов сбора дорожной платы, выяснили, что полицейские регулярно превышали скорость, подвергая горожан опасности. После расследования расходы полиции снизились на 84 %. Эта весьма эффектная позитивная социальная перемена способствовала тому, что в 2013 г. история удостоилась Пулитцеровской премии за вклад в жизнь общества[16]16
Kestin and Maines, “Cops Hitting the Brakes – New Data Show Excessive Speeding Dropped 84 % since Investigation.”
[Закрыть]. Флорида – родина многих хороших дата-журналистов. С одной стороны, из-за плодороднейшей почвы с точки зрения поиска историй. «Флорида давно обогнала Калифорнию по количеству диких, необычных и нелепых вещей, которые стали здесь обычным делом», – писал Джефф Кунер в 2013 г. для Orlando Sentinel[17]17
Kunerth, “Any Way You Look at It, Florida Is the State of Weird.”
[Закрыть]. Все, что делает государство США, априори публично, однако именно «солнечные законы» Флориды также гарантируют всем доступ к фотографиям, пленкам и аудиозаписям. Закон, гарантирующий такую открытость, означает, что получить государственные данные можно официально. Поэтому во Флориде много дата-журналистов и многие расследования происходят именно там.
Некоторые журналисты собирают данные из официальных источников и изучают их на предмет каких-либо идей, что иногда приводит к весьма неприятным фактам. Скажем, невероятным примером сотрудничества исследователей с представителями индустрии стал случай, когда дата-журналистка Шерил Филлипс из Стэнфордской лаборатории журналистики данных предложила своим студентам запросить информацию со всех 50 штатов о том, кого полицейские останавливали для проверки. Журналисты (не только из Стэнфорда) обнаружили, что белых останавливают реже[18]18
Pierson et al., “A Large-Scale Analysis of Racial Disparities in Police Stops across the United States.”
[Закрыть].
Под журналистикой данных также понимается анализ алгоритмической ответственности – небольшая профессиональная область, к которой я принадлежу. Алгоритмы и иные вычислительные инструменты используются в том числе для принятия решений – от нашего имени. Алгоритмы определяют стоимость степлера, которую вы видите во время онлайн-шопинга; они подсчитывают, сколько вы будете платить за медицинскую страховку. Алгоритм фильтрует ваши данные на предмет того, человек вы или бот, при подаче резюме через платформу поиска работы. Дело в том, что в рамках демократии целью свободной прессы является привлечение к ответственности тех, кто принимает решения. Аналитика алгоритмической ответственности как раз занимается этим в цифровом мире.
История под названием «Предвзятость машины» (Machine Bias), опубликованная в 2016 г. некоммерческой организацией ProPublica, – выдающийся пример анализа алгоритмической ответственности[19]19
Angwin et al., “Machine Bias.”
[Закрыть]. Журналисты ProPublica обнаружили, что алгоритм, используемый при вынесении судебного приговора, был настроен против афроамериканцев. Информация, собранная во время полицейского допроса, заносилась в компьютер. Затем алгоритм COMPAS анализировал данные и прогнозировал вероятность того, что человек вновь совершит правонарушение. Предполагалось, что подсчет поможет судьям принимать более объективные решения. В результате получилось, что афроамериканцы получали более долгие сроки, нежели белые.
Несложно заметить, насколько техношовинизм ослепил разработчиков COMPAS и не позволил им увидеть вред, который алгоритм может нанести. Вера в то, что решения, принятые компьютером, лучше или честнее, чем человеческие решения, приводит к тому, что нас перестает интересовать релевантность данных, представляемых системе. «Что посеешь, то и пожнешь» – легко об этом забыть, особенно если вы действительно хотите, чтобы компьютер оказался корректен. По-настоящему важно задумываться над тем, делают ли алгоритмы и их создатели мир лучше или хуже.
Данные используются в журналистике дольше, чем думает большинство людей. Первое журналистское расследование, основанное на сборе данных, появилось в 1967 г. При помощи методов социальных исследований и вычислительной машины Филип Мейер анализировал волнения на расовой почве в Детройте для Detroit Free Press. «Среди штатных журналистов бытовала теория, согласно которой бунтари всегда были наиболее ущемленными, беспомощными, находясь в самом низу экономической лестницы. Считалось, что они бунтуют потому, что у них нет иных способов для продвижения или выражения своей позиции, – писал Мейер. – Теория не подтверждалась данными»[20]20
Meyer, Precision Journalism, 14.
[Закрыть]. Он провел масштабный опрос и статистический анализ результатов при помощи вычислительной машины. Оказалось, что участники беспорядков принадлежали к разным социальным слоям. Эта история принесла ему Пулитцеровскую премию. Применение методов социальных исследований в журналистике Мейер тогда назвал точным репортерством.
Позднее, когда настольные компьютеры наводнили редакции, для отслеживания данных и поиска историй репортеры стали использовать электронные таблицы и базы данных. Точное репортерство превратилось в компьютеризированную журналистику. Компьютеризированная журналистика – это тип журналистского расследования, который вы могли наблюдать в фильме «В центре внимания» (Spotlight). Сюжет строится вокруг расследования журналистов Boston Globe (получившего Пулитцеровскую премию) о сексуальном насилии над детьми среди католических священников и о тех, кто это покрывал. Журналистам нужны были электронные таблицы и базы данных, чтобы следить за сотнями случаев, сотнями священников и их приходами. Для 2002 г. подобная журналистская практика считалась ультрасовременной.
По мере того как развивался интернет и появлялись новые цифровые инструменты, компьютеризированная журналистика превратилась в то, что мы сегодня называем журналистикой данных, которая (среди прочего) включает визуальную журналистику, вычислительную журналистику, картирование, аналитику данных, разработку ботов и анализ алгоритмической ответственности. Однако дата-журналисты в первую очередь журналисты. Для нас данные – это источник, и, чтобы рассказывать истории, мы используем ряд цифровых инструментов и платформ. Иной раз истории касаются последних новостей; время от времени они развлекательные; порой это запутанное расследования. Но они всегда информативны.
Организация ProPublica, появившаяся в 2008 г., и Guardian долгое время являются лидерами в области журналистики данных[21]21
Lewis, “Journalism in an Era of Big Data”; Diakopoulos, “Accountability in Algorithmic Decision Making”; Houston, Computer-Assisted Reporting; Houston and Investigative Reporters and Editors, Inc., The Investigative Reporter’s Handbook.
[Закрыть]. ProPublica была основана на благотворительных началах ветераном The Wall Street Journal Полом Стайгером, однако достаточно быстро завоевала репутацию расследовательского локомотива. У самого Стайгера за плечами был колоссальный опыт расследовательской журналистики: с 1997 по 2007 г. он был главным редактором в The Wall Street Journal, за это время команда журнала 16 раз получала Пулитцеровскую премию. Свою первую награду команда ProPublica получила в мае 2010 г. А в 2011 г. они получили премию за материал, опубликованный исключительно онлайн.
Многие истории, получившие эту награду, были созданы людьми, среди которых был дата-журналист или хотя бы тот, кто себя таковым считает. В сентябре 2006 г. журналист и программист Адриан Головатый, создатель фреймворка Django (которым пользовались многие редакции), опубликовал онлайн-статью «Основной путь необходимой трансформации для сайтов новостных изданий» (A Fundamental Way Newspaper Sites Need to Change)[22]22
Holovaty, “A Fundamental Way Newspaper Sites Need to Change.”
[Закрыть]. Он настаивал на том, что редакциям необходимо перешагнуть традиционную модель создания статей и начать внедрять практику структурирования данных в инструментарий журналистов. Его манифест привел к тому, что вместе с Биллом Эдейром, Мэттом Уэйтом и их командой он создал фактчекинговый сайт PolitiFact, также награжденный Пулитцеровской премией в 2009 г. Во время запуска проекта Уэйт писал: «Сайт представляет собой концепт простой старой газеты, переделанной для интернета. Мы взяли за основу политическую историю “отряда правды”, когда репортер, анализируя рекламную кампанию или агитационную речь, сначала проверяет все факты и только потом пишет историю. Мы взяли этот концепт, разделили на основные части и превратили в сайт, работающий на основе данных и посвященный периоду президентских выборов 2008 г.»[23]23
Waite, “Announcing Politifact.”
[Закрыть].
На этом Головатый не остановился и создал Every Block – первое новостное приложение, в котором были представлены данные о преступлениях c геолокациями. Именно там впервые использовался интерфейс Google Maps, что привело к тому, что API стал доступен рядовым пользователям[24]24
Holovaty, “In Memory of Chicagocrime.org.”
[Закрыть].
Прорыв в журналистике данных случился в 2009 г., когда репортеры и программисты Guardian запросили (посредством краудсорсинга) 450 000 записей о расходах членов парламента. За этим последовал скандал: выяснилось, что депутаты оплачивали бытовые и конторские расходы из государственного бюджета. Guardian также искусно овладела компьютерным анализом неофициальных сведений и просочившихся документов, которые использовали, например, в рамках расследований в период войн в Афганистане и Ираке[25]25
Daniel and Flew, “The Guardian Reportage of the UK MP Expenses Scandal”; Flew et al., “The Promise of Computational Journalism.”
[Закрыть].
Другое знаковое расследование – проект The Wall Street Journal об анализе дискриминации цен[26]26
Valentino-DeVries, Singer-Vine, and Soltani, “Websites Vary Prices, Deals Based on Users’ Information.”
[Закрыть]. Лидирующие сетевые магазины вроде Staples и Home Depot устанавливали на своих сайтах цены, которые менялись в зависимости от почтового индекса, который посетитель вводил. При помощи компьютерного анализа журналисты выяснили, что индекс, соответствующий условно более обеспеченной локации, приводил к более низким ценам, чем у тех, кто вводил индекс условно менее обеспеченных локаций.
Исследования придают журналистике данных определенную полноту, поскольку репортеры стремятся полагаться на научные методы анализа. Чтобы быть хорошим журналистом, нужно, с одной стороны, понимать, когда следует обращаться к эксперту в той или иной области и, с другой стороны, уметь отличать эксперта от подсадной утки. Дата-журналистам приходится совмещать ряд научных подходов из разных областей. В 2008 г. профессор Технологического института Джорджии Ирфан Эсса организовал первый симпозиум для программистов и журналистов. Это ежегодное событие, где журналисты, исследователи из различных областей компьютерных знаний, коммуникации, статистики, человеко-машинного взаимодействия, визуального дизайна и других делятся своими знаниями и выстраивают междисциплинарный диалог. Николас Диакопулос, профессор Северо-Западного университета, – один из основателей симпозиума и автор знаковых работ об алгоритмах обратного проектирования как способах поддержания подотчетности фигур принятия решений. В своем исследовании «Алгоритмическая ответственность: журналистские расследования вычислительных систем господства» (Algorithmic Accountability: Journalistic Investigation of Computational Power Structures) он описывает некоторые примеры собственных расследований и расследований коллег-журналистов, посвященные анализу алгоритмических «черных ящиков»[27]27
Diakopoulos, “Algorithmic Accountability.”
[Закрыть].
Несмотря на тесную связь с вычислительной теорией, журналистика данных считается дисциплиной, относящейся к социальным наукам, потому большинство фундаментальных работ по теме обнаруживается в корпусе социальной литературы. В 2012 г. К. Андерсон опубликовал статью «Навстречу социологии компьютерной и алгоритмической журналистики» (Towards a Sociology of Computational and Algorithmic Journalism), где объединил четыре подхода Шудсона к анализу новостей на основе результатов полевых этнографических исследований, проведенных в 2007–2011 гг.[28]28
Anderson, “Towards a Sociology of Computational and Algorithmic Journalism”; Schudson, “Four Approaches to the Sociology of News.”
[Закрыть] Этнографический контекст также был обогащен благодаря книге Никки Ашер «Интерактивная журналистика: Хакеры, данные и код» (Interactive Journalism: Hackers, Data, and Code), выпущенной в 2012 г.[29]29
Usher, Interactive Journalism.
[Закрыть] В ней Ашер представляет читателям как результаты полевых исследований, так и интервью с дата-журналистами из The New York Times, Guardian, ProPublica, WNYC (Общественное радио Нью-Йорка), AP, NPR (Национального общественного радио) и англоязычного подразделения «Аль-Джазиры». Работа Синди Роял о том, как журналисты используют программирование, важна для понимания его роли для редакций и актуальна с точки зрения возможной интеграции компьютерных навыков в программы подготовки журналистов[30]30
Royal, “The Journalist as Programmer.”
[Закрыть]. В книге 2016 г. «Детективы демократии» (Democracy detectives) Джеймс Гамильтон подчеркивал актуальность журналистики данных для общества – и рассуждал о цене подобного служения. Ведение по-настоящему судьбоносных расследований в рамках журналистики данных обходится в сотни тысяч долларов. «Производство этих историй может стоить тысячи долларов, но они приносят миллионы в форме выгоды для всего сообщества», – пишет Гамильтон[31]31
Hamilton, Democracy’s Detectives.
[Закрыть].
А в 2010 г. журналистика данных обзавелась подтверждающей печатью от самого Тима Бернерса-Ли: «Журналистам следует быть находчивыми в плане данных. Раньше для создания историй требовалось просто поболтать с человеком в баре, порой это работает и сейчас. Однако сегодня важно также внимательно изучать данные и вооружаться инструментами, позволяющими их анализировать и выбирать самое интересное. Важно видеть все в перспективе, помогать людям представлять общую картину происходящего в стране»[32]32
Arthur, “Analysing Data Is the Future for Journalists, Says Tim Berners-Lee.”
[Закрыть]. А когда Нэйт Силвер запустил проект FiveThirtyEight.com и написал книгу «Сигнал и шум» (Signal and Noise), термин журналистика данных уже получил широкое хождение среди журналистов[33]33
Silver, The Signal and the Noise.
[Закрыть].
Пока развивались компьютеры, человек оставался человеком. Людям нельзя давать расслабляться. Надеюсь, это книга поможет вам начать мыслить как дата-журналист, чтобы впредь вы не верили в сказки о технологиях и могли видеть несправедливость и неравенство в современном компьютеризированном мире. Присущий журналистам скепсис и умение предположить, что может пойти не так, способны помочь нам перейти от слепого технологического оптимизма к более разумной, сбалансированной перспективе того, как улучшить жизнь, а не подвергнуть ее риску и угрозам с помощью технологий.
II
Когда компьютеры не справляются
5
Почему ученики из малообеспеченных школ не справляются со стандартизированными тестами
Машины, коды, данные формируют удивительные и будоражащие воображение образы. Придерживаясь правильных расчетов, можно повысить прибыль, улучшить практику принятия решений, помочь вам найти себе пару и т. д. Величие данных горячо проповедуется и в современном образовании. В 2009 г. министр образования США произнес перед учеными следующее: «Я глубоко убежден, что сила данных способствует улучшению принимаемых нами решений. Данные предоставляют карту перемен. Они показывают, где мы находимся, куда нам следует двигаться и каковы категории наибольшего риска»[34]34
Министр образования США
[Закрыть].
Однако наивно полагать, что можно решить социальные проблемы при помощи одних лишь данных. Это я поняла, когда при помощи больших данных пыталась наладить работу местных общеобразовательных школ. Я потерпела неудачу: она связана с причинами, по которым современная технократическая американская система стандартизированных тестов никогда не заработает.
Однажды, когда мой сын был в первом классе, я, помогая ему с домашним заданием, столкнулась с проблемой.
– Мне нужно выписать природные ресурсы, – он мне сказал.
– Воздух, вода, нефть, газ, уголь, – ответила я.
– Я уже записал воздух и воду, – отозвался он. – Нефть, газ и уголь – это не природные ресурсы.
– Конечно, природные, – я возразила. – Они не возобновляемые, но все же природные ресурсы.
– Но их нет в списке, который учитель дал нам на уроке.
Быть родителем – значит иногда быть неготовым к ситуации, но в тот момент я столкнулась с настоящей эпистемологической дилеммой. Моя собственная эрудиция (и интернет) подсказывали, что вопрос предполагает множество «верных» ответов. Но только один из них позволит моему сыну получить наивысшую оценку за домашнее задание.
Я взглянула в рабочую тетрадь. На странице были изображены корова и зонт.
– Корова – это не природный ресурс, – произнесла я.
– Животные – это природный ресурс, – он ответил.
– Но коровы – часть природы, но не природный ресурс.
– Но учительница сказала, что животные тоже.
– А про зонтик ничего не было сказано?
– Я думаю, что зонтик обозначает воду. Я уже записал.
– Давай проверим в учебнике, – я чувствовала подступающее раздражение. – Если есть рабочая тетрадь, то найдется и учебник.
– Учебника нет, – ответил он.
– Ну, конечно, есть, – возразила я.
– Нам нельзя брать их домой, они только для работы в классе.
– Я помню, что учительница говорила, что есть онлайн-версии учебников. Она дала тебе адрес сайта или пароль?
– Нет.
Следующий час я провела в попытках войти на сайт, где можно было скачать учебник, а также в поисках его пиратской версии. Удача мне не улыбнулась.
Я знала, что стандартизированные тесты начнут давать в третьем классе. Однако если домашнее задание для первоклассника настолько сбивало с толку, то я не представляю, как он – или любой другой ребенок – должен будет сдавать эти тесты.
Поскольку я имела опыт общения с хакерами – людьми, которые, чтобы повеселиться, пишут программы для взлома государственных сайтов, – я, основываясь на опыте преподавания курса подготовки к академическим тестам (SAT), решила попробовать придумать алгоритм сдачи школьного теста. Строго говоря, я пыталась перехитрить актуальную тогда Пенсильванскую систему проверки для третьеклассников[35]35
Pennsylvania System of School Assessment (PSSA). – Прим. пер.
[Закрыть]. И вместе с командой профессиональных разработчиков создала программу с использованием ИИ для анализа доступных данных.
За последние несколько лет ИИ стал ценным для журналистов инструментом, в том числе потому, что автоматизированное составление статей помогло им эффективнее работать с повседневными новостями спорта и бизнеса. Машинное обучение помогает интерпретировать массивы данных, в результате на свет появились такие приложения для анализа документов, как Overview Project и DocumentCloud. Меня же интересовало третье расширение ИИ в рамках журналистики, помогающее обнаруживать истории: экспертные системы. Как было задумано первоначально, экспертная система будет действовать как человек-эксперт, сидящий в коробке, выдающей советы. К сожалению, это не сработало. Мышление и экспертное знание – категории до того сложные, что их попросту невозможно превратить в автоматизированные процедуры, совершаемые двоичными счетными машинами (которыми в конечном счете и являются современные компьютеры). Я предполагала, что концепт экспертной системы можно модифицировать для конкретного социального пространства таким образом, чтобы журналисты могли легко и эффективно обнаруживать прецеденты в огромных массивах данных.
Я спроектировала и написала софт, способный выполнять необходимый анализ данных. Я поговорила с учителями. Я поговорила с учениками. Я была в школах и сидела на встречах Комиссии по школьной реформе. Спустя шесть месяцев я поняла, что тест можно пройти. Но не благодаря хитрому алгоритму, а благодаря невероятно нетехнологичной практике: чтению книг, содержащих ответы.
Филадельфия – восьмой по количеству учащихся регион в стране, а ученики общеобразовательных школ невероятно бедны: в 2013 г. 79 % из них могли себе позволить обедать либо бесплатно, либо по сниженной цене. Лишь 64 % оканчивали школу, и меньше чем половине удалось пройти тестирование PSSA в 2013 г.
Если проблема существует в школах Филадельфии, значит, она есть и в других районах по всей стране. Одной из явных проблем, наблюдаемых в округах Нью-Йорка, Вашингтона, Чикаго, Лос-Анджелеса и других крупных городов, является то, что школы не могут себе позволить покупать учебники. В аккаунте школьного округа Филадельфии в Twitter однажды появился пост с фотографией бывшего мэра Майкла Наттера, раздающего 2000 книг, пожертвованных ученикам начальной школы. Но, к сожалению, знакомство детей с классической литературой не поможет им писать тесты с высокими результатами.
Все потому, что тесты не основываются на программе общеобразовательной подготовки. Я выяснила, что вопросы опираются на весьма конкретные знания, содержащиеся в конкретных учебниках – учебниках, созданных авторами тестирования.
Все это оказывается тесно связано с экономической стороной тестирования. По всей стране разработкой тестов занимаются лишь три компании: CTB/McGraw-Hill, Houghton Mifflin Harcourt (HMH) и Pearson. Они создают тесты и системы их оценки, а также выпускают учебники, по которым школьникам следует готовиться. Согласно материалам в прессе, HMH занимает 38 % рынка, а в 2013 г. прибыль компании составила $1,38 млрд.
В том же году штат Пенсильвания заключил многомиллионный контракт с компанией Data Recognition Corporation (DRC) для оценки тестов PSSA. Как оказалось, DRC сотрудничала с McGraw-Hill в рамках федерального контракта, по которому консорциуму следовало разрабатывать и оценивать тесты для всей страны. Тем временем McGraw-Hill также писала учебники и разрабатывала программы, которые школы покупали, чтобы подготовить детей к тестам. Например, «Математика на каждый день» (Everyday Math), брендированная программа, по которой учатся пятиклассники в большинстве пенсильванских школ, выпущена как раз McGraw-Hill.
Иначе говоря, учитель, который хочет подготовить учеников к тестам, должен учить их по учебнику одного из трех издательств. И, если посмотреть на содержание учебников и вопросы в тестах, окажется, что ответы на большинство вопросов действительно есть – это заметит даже третьеклассник. В 2012 г. издательство Pearson пережило серьезный скандал: выяснилось, что один из абзацев в тесте был полностью скопирован из учебника, изданного ими.
Проблемы возникают даже не столько с фактами или цифрами, сколько с конкретными словами. Предлагаю вам вопрос из теста PSSA за 2009 г., где третьеклассника просят записать четное трехзначное число и объяснить, почему выбрано именно это число. На рис. 5.1 мы видим пример корректного ответа, представленного Пенсильванским департаментом образования. Следом, на рис. 5.2, мы видим частично правильный ответ, за который ученик заработал один балл из двух возможных.
Второй ответ оказался лишь частично верным попросту потому, что третьеклассник не обладает определенной концептуальной базой, чтобы объяснить, почему его вариант ответа правильный. Подробное решение этой задачи можно найти в учебниках «Математика на каждый день» (Everyday Math), а в методических пособиях советуют также закрепить пройденный материал вопросами вроде «Каково правило различения целых и нецелых чисел? Как узнать, что подсчет верен?». Третьеклассник, у которого нет учебника, вполне может научиться различать оба типа чисел, однако сложности возникнут все равно, поскольку ему будет сложно угадать, как именно должен выглядеть ответ по мнению экзаменатора. В общем, эти тесты скорее подходят для «слабого» интеллектуального развития, но не «общего». Система обращается с детьми как с программами машинного обучения: если предполагается, что они должны выдавать правильный ответ на заданный вопрос (уже сомнительная цель, не так ли?), в них необходимо внедрить корректные данные – из учебников.
Не в пример университетским преподавателям, которые попросту дают студентам список литературы, учителя, работающие в школе, обязаны выдавать учебники. Однако это непростое дело – предоставить каждому ученику учебники для каждого предмета. Опираясь на то, что я выяснила в школах, побеседовав с учителями и детьми, можно сказать, что каждому ученику нужен один учебник и одна рабочая тетрадь для каждого предмета, также множество таблиц и проектов, которые учителя находят на разных сайтах (не говоря уже о зажимах для бумаги, картона, ножницах и прочих материалах для проектно-ориентированного обучения). Учебники можно использовать из года в год, но лишь в том случае, если образовательные стандарты не меняются – конечно, они менялись каждый год в течение последних 10 лет.
Осознав эту связь между учебниками и тестами, я попыталась выяснить, сколько конкретно школ в Филадельфии сталкиваются с нехваткой книг трех ведущих издательств. Кроме того, мне было любопытно посчитать, сколько будет стоить попытка закрыть этот дефицит.
Проблемы начались, когда я попросила в Управлении школьного округа Филадельфии список программ, используемых в школах. Дело в том, что, если вы хотите узнать, какие конкретно учебники имеются в школах, необходимо точно знать название учебных программ в школах. (Брендированные программы вроде «Математика на каждый день» позволяют школам выбивать неплохие скидки.)
– У нас нет такого списка, – ответил мне администратор отдела учебных программ и развития Филадельфии. – Его вообще не существует.
– Откуда вы тогда узнаете, по какой программе учатся в школах?! – удивилась я.
– Мы не знаем этого.
На этом конце провода воцарилась тишина.
– Откуда вы тогда знаете, что в школах достаточно необходимых учебников?
– Мы не знаем этого.
Согласно политике округа каждая школа самостоятельно проводит инвентаризацию системы хранения учебников при помощи централизованной базы данных.
– Если вы дадите мне список из системы хранения учебников, я смогу переделать его так, чтобы вы видели списки для отдельных школ, – сказала я администратору.
– Правда? – отозвалась она. – Было бы здорово. Не знала, что это можно сделать!
Я поступила так, как на моем месте поступил бы любой программист, – придумала обходное решение. Я написала программу, позволяющую просматривать данные каждой филадельфийской школы и видеть, соответствует ли количество учебников необходимой норме. Результаты выглядели не слишком хорошо. В среднем в одной школе насчитывалось 27 % учебников, рекомендованных администрацией. Как минимум в 10 школах нужных книг не было вовсе, согласно их же инвентаризационным данным. В иных были безнадежно устаревшие книги.
Правообладателям!
Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.Читателям!
Оплатили, но не знаете что делать дальше?