Викиданные

Материал из Викиреальностя
Перейти к: навигация, поиск
Нелокализованный логотип

Викиданные (Wikidata) — мультиязычный интернет-проект фонда Викимедиа для сохранения и транслирования технологическими средствами по разделам Википедии базовых сведений о предмете статей на нужном языке.

Содержание

[править] Основатели

Организационный, юридически оформленный устав проекта скрыт от широкой публики. Публично объявлено[1], что непосредственное отношение к проекту Wikidata имеют следующие организации:

  1. Allen Institute for Artificial Intelligence,
  2. Gordon and Betty Moore Foundation,
  3. Google (Google Inc.)

Подробности договоров на пожертвования спонсоров этого проекта неизвестны.

[править] Возможности проекта

Проект задуман наподобие Викисклада, но для данных: в нем могут храниться данные о численности населения и т. п. на централизованном хранилище. Возможно подключать данные оттуда включением, облегчая тем самым создание статей.[2]

[править] Планы развития

Предполагается, что сервис может оказать большое влияние на дальнейшее развитие как проектов фонда Викимедиа, так и на развитие всего Интернета в целом. Потенциал проекта Wikidata, вероятно, позволит качественно перестроить текущую систему создания и сопровождения статей всех многоязычных Википедий. Возможно, так же как и в Викискладе, в базе Wikidata можно будет хранить и другой свободный контент, не востребованный многоязычной энциклопедией «Википедия», но который можно будет использовать и на других сайтах в сети Интернет, не связанных с фондом Викимедиа.

Наполнение сервиса данными будет осуществляться волонтерами — участниками википроектов фонда Викимедиа, а также созданными ими ботами, которые из источников, с позволяющей это делать лицензией, автоматически будут добавлять и обновлять данные Wikidata.

На первом этапе деятельность ограничена сбором интервики; на следующем этапе планируется систематизация данных из карточек статей[3].

В качестве программного обеспечения используется Mediawiki с расширениями Wikibase[4].


[править] История

Обсуждение проекта Викиданных началось в середине двухтысячных. Отчасти подход был основан на опыте WiktionaryZ (сейчас — проект OmegaWiki)[5].

Ранний проект интерфейса Викиданных

Первое письмо в рассылке wikidata-l датируется 31 августа 2006-го года. В нём излагаются принципы, которые, по существу, начинаются реализовываться в 2012-м году[6].

Активная работа над проектом началась в апреле 2012 года. Первоначальное развитие проекта было профинансировано пожертвованиями объёмом в 1,3 миллиона евро[7][8][9]:

  • половину составили пожертвования Allen Institute for Artificial Intelligence [ai]²;
  • четверть — Gordon and Betty Moore Foundation в рамках своей программы Science;
  • четверть — Google, Inc.

[править] Редактирование

Редактирование «интервики»-записи про Берлин

На настоящий момент есть ряд служебных пространств имён, работа в которых аналогична остальным проектам, использующим Mediawiki, и основное пространство с базой знаний. В нём можно создать новую запись (англ. Entry), состоящую из идентификатора (метки, Qnnn), названия (англ. Label), описания (англ. Description) и набора содержащих значения интервики-ссылок объектов (англ. Item). Существующие записи можно поэлементно редактировать.

На этапе, релизуемом в течение ноября 2012 года, в Викиданных создаётся единая база интервики-ссылок разделов Википедии на различных языках.

Целью этого является:

  • Устранение дублирования информации об интервики-ссылках и, соответственно, устранение непродуктивной работы интервики-ботов, которые вынуждены отслеживать изменения интервики-ссылок во всех разделах и по обнаружению производить изменения в остальных разделах.
  • Облегчение разрешения интервики-конфликтов благодаря единству базы.
  • Формирование набора объектов, о которых есть статьи в Википедии. Это — список наиболее значимых объектов, для которых необходимо хранить знания.
Примеры карточек статей

Второй этап предполагает введение в Викиданные данных из карточек статей (как это делалось в рамках Google Squares и Nigma) и возможность использования в карточках статей в Википедии запросов из Викиданных.

[править] Лицензионная политика

Данные в основном пространстве имён распространяются на условиях лицензии Creative Commons Public Domain Dedication (CC0) — то максимально приближённо к общественному достоянию.

В остальных пространствах имён действует общая с Википедией лицензионная политика (Creative commons Share-Alike (CC-BY-SA) и GNU Free Documentation License), указанная в общих для всех проектов Викимедиа условиях использования.

[править] Техническая организация

Технически программное обеспечение Викиданных представляет из себя MediaWiki с семейством расширений Wikibase[4][10]:

  • Wikibase extension — для сервера (часто называется repo, репозиторий);
  • Wikibase Client extension — для клиентской инсталляции MediaWiki (например, для Википедии), которая использует данные из Викиданных (часто называется просто клиентом;
  • Wikibaselib extension — общая библиотечная для двух других расширений, перечисленных выше.

[править] План развёртывания

Шаги развёртывания[11]: 1-я фаза:

  • Создание репозитория Викаднных. В него можно добавлять только интервики-ссылки, данные нигде не используются.
  • Развёртывание клиентского расширения в одном разделе (в Википедии на венгерском языке).
  • Развёртывание клиентского расширения во втором разделе (в Википедии на иврите либо на итальянском языке).
  • Развёртывание клиентского расширения в английском разделе Википедии.
  • Развёртывание клиентского расширения во всех остальных разделах.

2-я фаза:

  • Введение простых запросов («Сан-Франциско — штат -> Калифорния»).
  • Введение ссылок на источники.
  • Введение квалификаторов.
  • Введение типов данных (в соответствии со степенью их истпользования в Википедии — ссылки, географические координаты, даты, статистика и т. д.).
  • Одновременно введение возможности запрашивать эти данные из Википедии.

[править] Критика

Викиданные подвергаются критике из-за лëгкости и жизнеспособности вандализма: фейковая информация, которая ранее могла быстро исправляться локально в больших посещаемых разделах, теперь может висеть днями, неделями, а то и вовсе оставаться незамеченной довольно продолжительное время по причине относительной малопопулярности среди участников и малочисленности проекта при тотальном его влиянии на все языковые разделы Википедии: не каждый участник Википедии сможет и захочет искать в Викиданных (за пределами «родной» вики) неверную строку для еë исправления.

Нередко в качестве вандализма служит внесение ложной информации о людях в их принадлежности к порноиндустрии или к сексуальным меньшинствам.

Например с 15 июня 2019 года в течении 9 дней жена президента США Мелания Трамп была описана как «бывшая секс-работница и порнозвезда», затем информацию скрыли[12] Менее повезло другим известным людям, вандальные характеристики которых Викиданные транслировали длительное время. Под вовремя не откаченное порноопределение в разное время на английском языке попадали такие актëры как Виолетта Исфель, Сара Али Хан, Ана Вильяфанье, Тила Данн, Макс Берлинер, Билли Рэй Сайрус. На португальском: Тони Рамос и Антонио Каллони. На испанском: Джейсон Момоа.

[править] Примечания

[править] Ссылки

Wikidata.org

Викиданные относится к теме «Фонд Викимедиа»   ±