Санкт-Петербургский университет
   1   2-3   4   5   6   7 
   8  9   10  11  12  13
   14  15  16  17  18  19   
ПОИСК
На сайте
В Яndex
Напишем письмо? Главная страница
№4 (3790), 6 марта 2009 года
инновации

Возможность заразиться «вирусом качества»

Сегодня в России специалисты в области баз данных, как и в более широкой области информационных технологий, очень востребованы на рынке труда. В определенный момент они понимают, что намного выгоднее заняться распространением, производством баз данных, но не научными исследованиями, — говорит в качестве вступления к разговору профессор факультета и главный побудитель проведения конференций в Санкт-Петербурге Борис Асенович Новиков. — В этой области сильные исследовательские группы сложились только в Санкт-Петербурге, Москве и Челябинске.

После Второй мировой войны в нашей области доминируют американские исследователи. Иногда это затрудняет продвижение работ, сделанных исследователями на других континентах. Конференции, о которых идет речь, проводятся по инициативе нескольких всемирно известных европейских исследователей начиная с 1987 года. Одна из основных целей этих конференций — создание равных условий для европейских ученых, конечно, не закрывая дорогу другим исследователям. За более чем 20 лет эти конференции завоевали статус наиболее престижных в своей области и привлекают исследователей со всего мира. Сейчас среди участников будут американцы, китайцы, канадцы, но самые активные страны — Германия, Италия, Греция, Австрия, Франция, Испания, Великобритания.

Предполагается, что в здание Двенадцати коллегий прибудут около 200 иностранных участников и примерно 50 соотечественников. Правда, по мнению Б.А.Новикова, последние не всегда стремятся на подобные конференции, потому что в России находиться на ведущих позициях гораздо легче, чем поддерживать сопоставимый с мировым уровень. Уровень конференции определяет и соотношение количества принятых докладов к общему числу поданных. В этом году из более чем 400 поданных отобрано 105 статей (только на EDBT), При этом слабые статьи почти не попадаются.

Ассоциация EDBT — постоянно действующий орган, в состав которого входят всемирно известные исследователи и который принимает решение, где в следующий раз будет проводиться конференция, кто будет отвечать за ее программу. Чтобы избежать застоя, каждый год это делают новые люди — на этот раз Мартин Керстон (Голландия) отвечал за научную программу EDBT, а Рональд Фейгин (США) — за программу ICDT. Отбор работ производится всегда на основании анонимного рецензирования, выполняемого программным комитетом.

На представителей Ассоциации при рассмотрении заявки Петербурга большое впечатление произвело Главное здание Университета. Для конференции всегда выбирают красивые европейские города, куда хочется поехать. Исследователи встречаются, чтобы общаться, заводить знакомства, обсуждать, и происходящее за пределами заседаний бывает не менее важным, чем доклады. Накануне основной конференции, в воскресенье пройдут узкоспециализированные семинары; с понедельника по среду — теоретическая конференция ICDT, со вторника по четверг — более широкая практическая EDBT. В этом году совместное проведение ставшей ежегодной и собирающей большое число участников EDBT и небольшой, но важной конференции по теории баз данных (ICDT) поспособствует взаимодействию участников и будет являться источником новых задач, идей.

Развитие технологий баз данных сегодня — это решение задач, возникающих как в новых областях применения, так и на стыках с другими науками. Интенсивно развивается биоинформатика: базы данных генов, белков, особенно в области производства питания. Помимо поиска в огромных массивах нужной информации и ее классификации, необходимо обеспечение качества, корректности, своевременности, согласованности данных. Как проверить достоверность чужих и гарантировать корректность своих данных? Как их интерпретировать, понять возможность их совместимости? Данные не всегда сопровождаются достаточной информаций о контексте.

В сообществе баз данных под понятием «база данных» принято считать все, что хранит как-то организованные данные, способы организации и использования. Задача — превращение данных, сваленных в кучу, в структуру с выделением смысла, нахождение полезного. Понятие базы данных возникло в середине 60-х годов в связи с особой важностью вопросов надежного хранения и корректности данных. Такие требования, возникают, например, в банковских применениях, когда стоимость данных во много раз выше, чем стоимость отдельных операций.

— Когда вы смотрите на данные, вы не всё про них знаете, их смысл надо как-то описывать. Невозможно унифицировать весь мир, данные будут разнородными. Если говорят, что на улице 100°, легко догадаться, что это °F. Как научить компьютер это понимать, чтобы нас хотя бы предупреждали о непривычных данных. Интеграцией данных исследователи занимаются уже больше полутора десятилетий, делаются важные мелкие шаги, но научить машину создать свою информацию на основе других данных не может пока никто. Наиболее важным результатом последних лет в исследованиях можно считать попытки рассматривать Интернет как базу данных, извлекать структурированную информацию.

Главное, чего ждет профессор Новиков от конференции в Петербурге — побуждение молодых исследователей, в первую очередь аспирантов, к качественной деятельности:

— В 1996 г. я вывез двух пятикурсников на аспирантский семинар (соревнование с более сильными) за границу. Подготовленные ими доклады были самыми слабыми. Но они увидели на каком уровне можно заниматься наукой, и на них это произвело такое впечатление, что через 4 года они защитили совершенно блестящие диссертации, и сейчас это видные исследователи в России. Прослушанный доклад может дать новый взгляд на ту тему, которой они уже занимаются. Я жду, что мои аспиранты и российские коллеги заразятся «вирусом качества» и больше не смогут делать плохие исследования, что повысится уровень публикаций. Если приедет 30 человек из России, будет большой успех. Своих студентов я могу привлечь только к организации — помогать участникам, когда понадобится. В то же время они смогут слушать доклады на заседаниях, не платя больших организационных взносов. А поймать чужого профессора, задать коварный вопрос и посмотреть, как тот будет выкручиваться, — захватывающе интересно. В конце концов, они могут рассказать чужому профессору, чем занимаются сами, а он сходу придумает комментарий. Что не менее важно — познакомятся с молодыми зарубежными коллегами, начнут создавать собственную сеть связей.

Почему такие ожидания могут оправдаться, подтверждает еще один пример. На одну из конференций по базам данных, проводившуюся в 1997 г. в Петербурге, приехал очень известный исследователь из Калифорнии Эктор Гарисиа Молина (Стенфордский университет) с часовым докладом о слабоструктурированных данных (что в тот момент было новостью) — что делать, если на данные не удается навести жесткую структуру, если в базах данных встречаются отклонения, исключения. Молодая и смелая аспирантка Екатерина Горшкова выразила желание заняться этой темой. Сейчас это одно из важных направлений нашей группы — три или четыре диссертации защитили по этой тематике. Получили гранты промышленной компании на развитие конкретных тем. Чтобы исследование воспринималось, нужен интерес к этой теме в мире именно сейчас. В этом плане приглашенные доклады дают определенную ориентацию, понимание того, чем стоит заниматься.  

Ксения Капитоненко

© Журнал «Санкт-Петербургский университет», 1995-2009 Дизайн и сопровождение: Сергей Ушаков