Эффективный анализ больших данных, извлеченных из наукометрической базы Scopus

Неретин, Артём Александрович Отделение экспериментальной физики (ОЭФ)
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

Данная работа описывает основные моменты разработки программного обеспечения для выгрузки и анализа данных из API Scopus, предоставляемое Elsevier. Представлены методы кластерного анализа для построения взаимосвязей на основе графов.

Введение …………………………………………………………………………………………………. 12
Глава 1. Теоретическая часть ………………………………………………………………… 13
1.1. Методика расчёта CiteScore………………………………………………………….. 13
1.2. Реляционная база данных PostgreSQL ………………………………………… 14
1.3. GET и POST запросы……………………………………………………………………. 15
1.4. Наукометрические базы данных………………………………………………….. 15
1.5. Выгрузка данных …………………………………………………………………………. 18
1.6. Кластерный анализ ………………………………………………………………………. 20
1.7. Облако тегов ………………………………………………………………………………… 21
Глава 2. Практическая часть…………………………………………………………………. 23
2.1. Разработка и реализация структуры базы данных ……………………… 23
2.2. Выгрузка данных с использованием автоматизированного скрипта
…………………………………………………………………………………………………………….. 24
2.3. Первичный количественный анализ …………………………………………… 26
2.4. Построение облака тегов ……………………………………………………………… 27
2.5. Выделение кластеров ученных ……………………………………………………. 28
2.6. Построение облака тегов имён авторов ………………………………………. 32
2.7. Анализ кластеров …………………………………………………………………………. 32
Глава 3. Финансовый менеджмент, ресурсоэффективность и
ресурсосбережение …………………………………………………………………………………. 34
3.1. Потенциальные потребители результатов исследования …………… 34
3.2. Анализ конкурентных технических решений с позиции
ресурсоэффективности и ресурсосбережения…………………………………….. 34
3.3. Диаграмма Исикава……………………………………………………………………… 36
3.4. SWOT-анализ ……………………………………………………………………………….. 37
3.5. Оценка готовности проекта к коммерциализации ……………………… 38
3.6. Методы коммерциализации результатов научно-технического
исследования. ……………………………………………………………………………………….. 40
3.5. Инициация проекта ……………………………………………………………………… 40
3.5.1 Цели и результат проекта. …………………………………………………………………………………………40
3.5.2 Организационная структура проекта. …………………………………………………………………….41
3.5.3 Ограничения и допущения проекта. ……………………………………………………………………….42
3.6. Планирование управления научно-техническим проектом ……….. 42
3.6.1. План проекта ……………………………………………………………………………………………………..42
3.6.3. Бюджет научного исследования ……………………………………………………………………………..46
3.6.4. Организационная структура проекта …………………………………………………………………….47
3.6.5. Расчёт электроэнергии ……………………………………………………………………………………………47
3.6.6. Накладные расходы ………………………………………………………………………………………………..47
3.6.7. Бюджет научного исследования ……………………………………………………………………………..48
3.6.8. Реестр рисков проекта …………………………………………………………………………………………….49

3.7. Определение ресурсной (ресурсосберегающей), финансовой,
бюджетной, социальной и экономической эффективности
исследования ………………………………………………………………………………………. 50
3.7.1 Оценка сравнительной эффективности исследования ……………………………………..50

Глава 4. Социальная ответственность. …………………………………………………. 52
1. Социальная ответственность …………………………………………………………….. 52
4.1. Описание рабочего места……………………………………………………………… 52
4.2. Анализ выявленных вредных факторов проектируемой
производственной среды …………………………………………………………………….. 53
4.3. Микроклимат в помещении…………………………………………………………. 55
4.4. Освещенность ………………………………………………………………………………. 56
4.5. Электромагнитные поля………………………………………………………………. 60
4.6. Шум ………………………………………………………………………………………………. 61
4.7. Организация рабочего места оператора ПЭВМ ………………………….. 62
4.8. Анализ опасных производственных факторов ……………………………. 65
4.9. Электробезопасность ……………………………………………………………………. 65
4.10. Защита в чрезвычайных ситуациях …………………………………………… 68
4.11. Пожарная безопасность ……………………………………………………………… 69
4.12. Экологическая безопасность ……………………………………………………… 70
4.13. Научно техническая документация …………………………………………… 73
4.14. Выводы и рекомендации ………………………………………………………………. 74
Список литературы ……………………………………………………………………………….. 76
Приложение А. Пример данных о статье (XML формат) ……………………… 78
Приложение Б. Метод класса отправки запросов …………………………………. 79
Приложение В. Метод получения данных по номеру журнала …………….. 80
Приложение Г ………………………………………………………………………………………… 82
Приложение Д ………………………………………………………………………………………… 83
Приложение Е ………………………………………………………………………………………… 84

Теперь, как никогда ранее научное сообщество располагает огромным
количеством материала. Согласно некоторым исследованиям, объём
производства научных публикаций удваивается каждые девять лет [6].
Благодаря быстрому развитию информационно-коммуникационных
технологий (ИКТ), теперь можно получить доступ к большей части научной
литературы через интернет [7], что позволяет более эффективно передавать
знания. Однако этот процесс также ведёт к усилению конкуренции между
исследователями и увеличению требований к качеству материала. Эти
изменения побуждают исследователей, особенно тех, кто находится на ранних
этапах своей карьеры, сотрудничать с другими исследователями из своего или
другого учреждения. Динамичность такого партнёрства делает анализ сети
научного сотрудничества предметом большого интереса.
В основном для оценки автора используются индикаторы, полученные
через поисковые системы, такие как Google Scholar, Scopus и т.д., которые
включают количество и качество публикаций на основе журнальных и
авторских показателей. Тем не менее, эти критерии не учитывают взаимосвязь
между авторами. Хотя глобализация науки в современном мире обусловлена
сотрудничеством между исследователями и это стало большой проблемой
анализа эффективности работы конкретных авторов.
Данная работа направлена на определение структур сотрудничества
между исследователями в области «Экономики, Эконометрики и Финансов»
(ECON) и выявлении учреждений, направленных на данную тематику. В
качестве основного критерия используется сотрудничество в публикациях.
Доступ к данным осуществляется с помощью интерфейса Scopus Database API
[8].

Получена информация о 78354 статьях из области “Экономика, Эконометрика
и Финансы”, информация о 22712 авторах и их принадлежности к
университетам или научным организациям. Произведен первичный анализ
полученных данных. Все авторы были разбиты на кластеры, которые
основываются на взаимосвязи авторов через совместное написание работ.
Выявлена тенденция к неоднократному сотрудничества авторов,
занимающихся одной или смежными областями науки. Интерфейс реализован
на языке PHP, данные были выгружены в реляционную базу данных
PostgresSQL, анализ произведён при помощи языка R. Максимальное
количество соавторов для одной работы из статей, попавших в выборку,
равняется 39.

1)T.A. Brooks , Private acts and public objects: an investigation of citer
motivations, Journal of the American Society for Information Science 36(4) (1985)
223-229.
2)Bárbara S. Lancho-Barrantes, Vicente P. Guerrero-Bote, Félix Moya-
Anegón. What lies behind the averages and significance of citation indicators in
different disciplines? Article first published online: April 13, 2010. Volume: 36
issue: 3, page(s): 371-382.
3)Cristopher J. Date, Introduction to Database Systems, 2003.
4)Иванова Г.С. Основы программирования: Учебник для вузов. – М.:
Изд-во МГТУ им. Н.Э. Баумана, 2002. – 416 с.
5)Welling L., Thomson L. PHP and MySQL Web Development (4th
Edition). Addison-Wesley Professional, 2008 – 1008 p.
6)Noorden, R. V., 5 2014. Global scientific output doubles every nine
years.Mathematics&EconomicsNatureNewsBlog,
http://blogs.nature.com/news/2014/05/global-scientific-output-doubles-every-nine-
years.html.
7)Asadi, S., Dahlan, H. M., et al., 2017. Organizational research in the
field of green it: A systematic literature review from 2007 to 2016. Telematics and
Informatics.
8)Elsevier,2017.ScopusdatabaseAPIinterface.
https://dev.elsevier.com/ .
9)Uddin S., Hossain L., Rasmussen K. 2013. Network effect on scientific
collaborations. PloS One 8 (2), e57546
10) Schlattmann S., 2017. Capturing the collaboration intensity of research
institutions using social network analysis. Procedia Computer Science 106, 25–31.
11) Baghdadi, H. S., Ranaivo-Malan¸con, B., 2011. An automatic topic
identification algorithm. Journal of Computer Science 7 (9), 1363.
12) Can˜as-Guerrero, I., Mazarron, F., Pou-Merina, A., Calleja-Perucho,
C., Diaz Rubio, G., 2013. Bibliometric analysis of research activity in the
“agronomy” category from the web of science, 1997-2011. European Journal of
Agronomy 50 19–28.
13) Szymanski, B., De La Rosa, J., Krishnamoorthy, M., 2012. An internet
measure of the value of citations. Information Sciences 185 (1), 18–31.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    [telegram]

    Последние выполненные заказы

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Анастасия Л. аспирант
    5 (8 отзывов)
    Работаю в сфере метрологического обеспечения. Защищаю кандидатскую диссертацию. Основной профиль: Метрология, стандартизация и сертификация. Оптико-электронное прибост... Читать все
    Работаю в сфере метрологического обеспечения. Защищаю кандидатскую диссертацию. Основной профиль: Метрология, стандартизация и сертификация. Оптико-электронное прибостроение, управление качеством
    #Кандидатские #Магистерские
    10 Выполненных работ
    Дмитрий К. преподаватель, кандидат наук
    5 (1241 отзыв)
    Окончил КазГУ с красным дипломом в 1985 г., после окончания работал в Институте Ядерной Физики, защитил кандидатскую диссертацию в 1991 г. Работы для студентов выполня... Читать все
    Окончил КазГУ с красным дипломом в 1985 г., после окончания работал в Институте Ядерной Физики, защитил кандидатскую диссертацию в 1991 г. Работы для студентов выполняю уже 30 лет.
    #Кандидатские #Магистерские
    2271 Выполненная работа
    Дарья С. Томский государственный университет 2010, Юридический, в...
    4.8 (13 отзывов)
    Практикую гражданское, семейное право. Преподаю указанные дисциплины в ВУЗе. Выполняла работы на заказ в течение двух лет. Обучалась в аспирантуре, подготовила диссерт... Читать все
    Практикую гражданское, семейное право. Преподаю указанные дисциплины в ВУЗе. Выполняла работы на заказ в течение двух лет. Обучалась в аспирантуре, подготовила диссертационное исследование, которое сейчас находится на рассмотрении в совете.
    #Кандидатские #Магистерские
    18 Выполненных работ
    Катерина В. преподаватель, кандидат наук
    4.6 (30 отзывов)
    Преподаватель одного из лучших ВУЗов страны, научный работник, редактор научного журнала, общественный деятель. Пишу все виды работ - от эссе до докторской диссертации... Читать все
    Преподаватель одного из лучших ВУЗов страны, научный работник, редактор научного журнала, общественный деятель. Пишу все виды работ - от эссе до докторской диссертации. Опыт работы 7 лет. Всегда на связи и готова прийти на помощь. Вместе удовлетворим самого требовательного научного руководителя. Возможно полное сопровождение: от статуса студента до получения научной степени.
    #Кандидатские #Магистерские
    47 Выполненных работ
    Яна К. ТюмГУ 2004, ГМУ, выпускник
    5 (8 отзывов)
    Помощь в написании магистерских диссертаций, курсовых, контрольных работ, рефератов, статей, повышение уникальности текста(ручной рерайт), качественно и в срок, в соот... Читать все
    Помощь в написании магистерских диссертаций, курсовых, контрольных работ, рефератов, статей, повышение уникальности текста(ручной рерайт), качественно и в срок, в соответствии с Вашими требованиями.
    #Кандидатские #Магистерские
    12 Выполненных работ
    Татьяна С. кандидат наук
    4.9 (298 отзывов)
    Большой опыт работы. Кандидаты химических, биологических, технических, экономических, юридических, философских наук. Участие в НИОКР, Только актуальная литература (пос... Читать все
    Большой опыт работы. Кандидаты химических, биологических, технических, экономических, юридических, философских наук. Участие в НИОКР, Только актуальная литература (поставки напрямую с издательств), доступ к библиотеке диссертаций РГБ
    #Кандидатские #Магистерские
    551 Выполненная работа
    Александр О. Спб государственный университет 1972, мат - мех, преподав...
    4.9 (66 отзывов)
    Читаю лекции и веду занятия со студентами по матанализу, линейной алгебре и теории вероятностей. Защитил кандидатскую диссертацию по качественной теории дифференциальн... Читать все
    Читаю лекции и веду занятия со студентами по матанализу, линейной алгебре и теории вероятностей. Защитил кандидатскую диссертацию по качественной теории дифференциальных уравнений. Умею быстро и четко выполнять сложные вычислительные работ
    #Кандидатские #Магистерские
    117 Выполненных работ
    Екатерина Д.
    4.8 (37 отзывов)
    Более 5 лет помогаю в написании работ от простых учебных заданий и магистерских диссертаций до реальных бизнес-планов и проектов для открытия своего дела. Имею два об... Читать все
    Более 5 лет помогаю в написании работ от простых учебных заданий и магистерских диссертаций до реальных бизнес-планов и проектов для открытия своего дела. Имею два образования: экономист-менеджер и маркетолог. Буду рада помочь и Вам.
    #Кандидатские #Магистерские
    55 Выполненных работ
    Вики Р.
    5 (44 отзыва)
    Наличие красного диплома УрГЮУ по специальности юрист. Опыт работы в профессии - сфера банкротства. Уровень выполняемых работ - до магистерских диссертаций. Написан... Читать все
    Наличие красного диплома УрГЮУ по специальности юрист. Опыт работы в профессии - сфера банкротства. Уровень выполняемых работ - до магистерских диссертаций. Написание письменных работ для меня в удовольствие.Всегда качественно.
    #Кандидатские #Магистерские
    60 Выполненных работ

    Другие учебные работы по предмету

    Кооперативные игры на гиперграфах
    📅 2019год
    🏢 Санкт-Петербургский государственный университет