Викиданные
Викиданные (Wikidata) — мультиязычный интернет-проект фонда Викимедиа для сохранения и транслирования технологическими средствами по разделам Википедии базовых сведений о предмете статей на нужном языке.
Содержание |
[править] Основатели
Организационный, юридически оформленный устав проекта скрыт от широкой публики. Публично объявлено[1], что непосредственное отношение к проекту Wikidata имеют следующие организации:
- Allen Institute for Artificial Intelligence,
- Gordon and Betty Moore Foundation,
- Google (Google Inc.)
Подробности договоров на пожертвования спонсоров этого проекта неизвестны.
[править] Возможности проекта
Проект задуман наподобие Викисклада, но для данных: в нем могут храниться данные о численности населения и т. п. на централизованном хранилище. Возможно подключать данные оттуда включением, облегчая тем самым создание статей.[2]
[править] Планы развития
Предполагается, что сервис может оказать большое влияние на дальнейшее развитие как проектов фонда Викимедиа, так и на развитие всего Интернета в целом. Потенциал проекта Wikidata, вероятно, позволит качественно перестроить текущую систему создания и сопровождения статей всех многоязычных Википедий. Возможно, так же как и в Викискладе, в базе Wikidata можно будет хранить и другой свободный контент, не востребованный многоязычной энциклопедией «Википедия», но который можно будет использовать и на других сайтах в сети Интернет, не связанных с фондом Викимедиа.
Наполнение сервиса данными будет осуществляться волонтерами — участниками википроектов фонда Викимедиа, а также созданными ими ботами, которые из источников, с позволяющей это делать лицензией, автоматически будут добавлять и обновлять данные Wikidata.
На первом этапе деятельность ограничена сбором интервики; на следующем этапе планируется систематизация данных из карточек статей[3].
В качестве программного обеспечения используется Mediawiki с расширениями Wikibase[4].
[править] История
Обсуждение проекта Викиданных началось в середине двухтысячных. Отчасти подход был основан на опыте WiktionaryZ (сейчас — проект OmegaWiki)[5].
Первое письмо в рассылке wikidata-l датируется 31 августа 2006-го года. В нём излагаются принципы, которые, по существу, начинаются реализовываться в 2012-м году[6].
Активная работа над проектом началась в апреле 2012 года. Первоначальное развитие проекта было профинансировано пожертвованиями объёмом в 1,3 миллиона евро[7][8][9]:
- половину составили пожертвования Allen Institute for Artificial Intelligence [ai]²;
- четверть — Gordon and Betty Moore Foundation в рамках своей программы Science;
- четверть — Google, Inc.
[править] Редактирование
На настоящий момент есть ряд служебных пространств имён, работа в которых аналогична остальным проектам, использующим Mediawiki, и основное пространство с базой знаний. В нём можно создать новую запись (англ. Entry), состоящую из идентификатора (метки, Qnnn), названия (англ. Label), описания (англ. Description) и набора содержащих значения интервики-ссылок объектов (англ. Item). Существующие записи можно поэлементно редактировать.
На этапе, релизуемом в течение ноября 2012 года, в Викиданных создаётся единая база интервики-ссылок разделов Википедии на различных языках.
Целью этого является:
- Устранение дублирования информации об интервики-ссылках и, соответственно, устранение непродуктивной работы интервики-ботов, которые вынуждены отслеживать изменения интервики-ссылок во всех разделах и по обнаружению производить изменения в остальных разделах.
- Облегчение разрешения интервики-конфликтов благодаря единству базы.
- Формирование набора объектов, о которых есть статьи в Википедии. Это — список наиболее значимых объектов, для которых необходимо хранить знания.
Второй этап предполагает введение в Викиданные данных из карточек статей (как это делалось в рамках Google Squares и Nigma) и возможность использования в карточках статей в Википедии запросов из Викиданных.
[править] Лицензионная политика
Данные в основном пространстве имён распространяются на условиях лицензии Creative Commons Public Domain Dedication (CC0) — то максимально приближённо к общественному достоянию.
В остальных пространствах имён действует общая с Википедией лицензионная политика (Creative commons Share-Alike (CC-BY-SA) и GNU Free Documentation License), указанная в общих для всех проектов Викимедиа условиях использования.
[править] Техническая организация
Технически программное обеспечение Викиданных представляет из себя MediaWiki с семейством расширений Wikibase[4][10]:
- Wikibase extension — для сервера (часто называется repo, репозиторий);
- Wikibase Client extension — для клиентской инсталляции MediaWiki (например, для Википедии), которая использует данные из Викиданных (часто называется просто клиентом;
- Wikibaselib extension — общая библиотечная для двух других расширений, перечисленных выше.
[править] План развёртывания
Шаги развёртывания[11]: 1-я фаза:
- Создание репозитория Викаднных. В него можно добавлять только интервики-ссылки, данные нигде не используются.
- Развёртывание клиентского расширения в одном разделе (в Википедии на венгерском языке).
- Развёртывание клиентского расширения во втором разделе (в Википедии на иврите либо на итальянском языке).
- Развёртывание клиентского расширения в английском разделе Википедии.
- Развёртывание клиентского расширения во всех остальных разделах.
2-я фаза:
- Введение простых запросов («Сан-Франциско — штат -> Калифорния»).
- Введение ссылок на источники.
- Введение квалификаторов.
- Введение типов данных (в соответствии со степенью их истпользования в Википедии — ссылки, географические координаты, даты, статистика и т. д.).
- Одновременно введение возможности запрашивать эти данные из Википедии.
[править] Критика
Викиданные подвергаются критике из-за лëгкости и жизнеспособности вандализма: фейковая информация, которая ранее могла быстро исправляться локально в больших посещаемых разделах, теперь может висеть днями, неделями, а то и вовсе оставаться незамеченной довольно продолжительное время по причине относительной малопопулярности среди участников и малочисленности проекта при тотальном его влиянии на все языковые разделы Википедии: не каждый участник Википедии сможет и захочет искать в Викиданных (за пределами «родной» вики) неверную строку для еë исправления.
Нередко в качестве вандализма служит внесение ложной информации о людях в их принадлежности к порноиндустрии или к сексуальным меньшинствам.
Например с 15 июня 2019 года в течении 9 дней жена президента США Мелания Трамп была описана как «бывшая секс-работница и порнозвезда», затем информацию скрыли[12] Менее повезло другим известным людям, вандальные характеристики которых Викиданные транслировали длительное время. Под вовремя не откаченное порноопределение в разное время на английском языке попадали такие актëры как Виолетта Исфель, Сара Али Хан, Ана Вильяфанье, Тила Данн, Макс Берлинер, Билли Рэй Сайрус. На португальском: Тони Рамос и Антонио Каллони. На испанском: Джейсон Момоа.
[править] Примечания
- ↑ https://meta.wikimedia.org/wiki/Wikidata/ru
- ↑ https://ru.wikipedia.org/w/index.php?title=Википедия:Форум/Новости&diff=43534083
- ↑ Викиданные: введение // wikidata.org (копия)
- ↑ 4,0 4,1 Help:Terminology // wikidata.org (копия)
- ↑ Sabine Emmy Eller Geocodes … or how various Wikipedias can co-operate // sabinecretella.blogspot.com
- ↑ Sabine Cretella Creating contents for many Wikipedias // wikidata-l
- ↑ m:wikidata // meta.wikimedia.org
- ↑ Data Revolution for Wikipedia // wikimedia.de
- ↑ Sarah Perez Wikipedia’s Next Big Thing: Wikidata, A Machine-Readable, User-Editable Database Funded By Google, Paul Allen And Others] // TechCrunch.com
- ↑ Extension:Wikibase // mediawiki.org
- ↑ Wikidata/Notes/Deployment // meta.wikimedia.org
- ↑ Мелания Трамп (вандализм)
[править] Ссылки
Викиданные относится к теме «Фонд Викимедиа» |