Грант РНФ Дубна-РЭУ
Работы по гранту РНФ Дубна-РЭУ № 19-71-30008.
Содержание
1 Подбор задачи для исполнения
1.1 2021-02-12
1.1.1 Анализ задач на 2021 год
- Компьютерная поддержка мегапроектов.
- Интеграция промежуточного обеспечения и прикладного программного обеспечения пользователей.
- Судя по всему, предполагается разработка собственной или использование существующей системы инвентаризации инфраструктуры, типа GLPI (https://glpi-project.org/).
- Работа, скорее всего, в основном выполненная.
- Для эффективной эксплуатации комплексной системы необходимы средства мониторинга и анализа поведения.
- Насколько я понимаю, предполагается разработка системы мониторинга.
- Предположу, что в проекте будет использован самостоятельно написанный программный продукт
- Интеграция промежуточного обеспечения и прикладного программного обеспечения пользователей.
- Система анализа рынка труда.
- Предполагаю, что под этим пунктом находится вполне зрелый и серьёзный проект по анализу рынков труда.
- Предполагается использование классических методов анализа данных, без нейронных сетей.
- Участники данного проекта, скорее всего, имеют доступ к закрытым данным.
- Развитие прототипа аналитической платформы.
- В данном проекте предполагается конструирование систем распознавания речи.
- Задачи расписаны крайне грамотно: даже если не все получится, можно будет отчитаться в рамках поставленных задач.
- Мультиагентные системы для организации полного цикла сбора и анализа данных.
- Системы поиска и анализа информации в интернете (например, для оперативно-розыскной деятельности).
- Направление достаточно разработанное, понятно что делать.
- Скорее всего, система уже работает.
- Система и методы анализа потоковой информации.
- Судя по постановке задачи, предполагается использовать методику суррогатного моделирования.
- В задании видны все основные этапы построения суррогатной модели.
- Впрочем, возможно что будут использованы лишь отдельные методы анализа.
- В качестве набора данных предполагается использовать сетевой трафик.
- Большое внимание уделяется развёртыванию инфраструктуры хранения больших данных и доступа к ним.
- Создание “Озёра научных данных”.
- Озёра научных данных — это “новый чёрный”1.
- Идеологически они должны вывести инфраструктуру GRID на новый качественный уровень.
- Нам не вполне понятно, какая часть касается теоретических исследований с модельными данными, а какая работает со структурой данных ОИЯИ.
1.1.2 Резюме
- Все представленные задачи имеют большой существующий задел и, судя по всему, будет сложно быстро включиться в разработку человеку со стороны.
- В научном плане мы были ориентированы на исследования с применением технологий машинного обучения, в частности, технологий нейронных сетей.
- Применение машинного обучения предполагается только в проекте “Система и методы анализа потоковой информации”.
1.1.3 Возможные направления исследования
Исследование озёр данных
Исследования по тематике Озёра данных находятся в списке научных задач в рамках гранта. В данном случае можно выделить два аспекта:
- инженерное исследование Озёр данных;
- научное исследование Озёр данных (например, моделирование).
Следует отметить, что если по инженерным аспектам информация, в принципе, доступна, то по научным исследованиям Озёр данных достаточно мало работ.
Этапы исследования
- Исследование по инженерным аспектам проектирования и использования Озёр данных. Предполагаются публикации:
- конференция ITTMM-2021, публикация в CEUR;
- конференция GRID.
- Моделирование Озёр данных. Предполагается публикация уровня Q3 Scopus.
- Исследование по инженерным аспектам проектирования и использования Озёр данных. Предполагаются публикации:
Суррогатное моделирование
При компьютерном моделировании исследуется математическое описание моделей. При этом решения ищутся путём расчёта соответствующих математических уравнений. Зачастую для моделирования требуются большого количество прогонов модели для различных комбинаций параметров. Компьютерное моделирование, как правило, ресурсоёмко (а значит, и дорого). Кроме того, оно требует большого количества времени. Подобные же недостатки имеют и имитационные модели.
При современном развитии компьютерной техники приобретают большую популярность для практического применения суррогатные модели.
Суррогатное моделирование строит статистическую модель, чтобы точно аппроксимировать результат других видов моделирования. Впоследствии эта обученная модель может заменить исходную модель при выполнении анализа системы. Методы суррогатного моделирования делают дорогостоящие исследования более доступными, так как оценка обученной статистической модели намного быстрее, чем оценка исходного моделирования, выполнения множество экспериментов при различных комбинациях параметров проектирования. Суррогатное моделирование — это частный случай контролируемого машинного обучения.
Этапы исследования
- Разработка программного комплекса для поддержки построения суррогатных моделей на основе больших данных.
- Демонстрация применения разработанного инструментального комплекса для построения модели эксперимента (какого, пока не можем сказать).
- Разработка методики построения автономной (standalone) реализации суррогатной модели. Данная реализация может использоваться, например, для фильтрации показаний детекторов в реальном времени.
Термин “новый чёрный” пришёл из мира моды. Означает, что описываемый объект является суперхитом. ↩︎