Hugo. Сайт научника. Импорт списка публикаций

2025-10-02 · 3 мин. для прочтения

Hugo. Сайт научника. Импорт списка публикаций.

Содержание

1 Программа для импорта

Hugo. Шаблон для научных работников. Библиография
Используется пакет academic.
PyPi: https://pypi.org/project/academic/
Репозиторий: https://github.com/BuildLore/academic-file-converter
Инструмент позволяет автоматически генерировать страницы публикаций для сайтов на базе Hugo (например, Wowchemy), включая книги, статьи и препринты.
Поддерживает интеграцию медиафайлов (PDF, изображения) и настройку метаданных.

1.1 Установка

pipx install academic

1.2 Использование

academic import my_publications.bib content/publication/

2 Исправления для Hugo-blox

В hugo-blox изменилась структура файлов.

2.1 Обновление формата на примере поля DOI

Раньше DOI указывался на верхнем уровне YAML-файла, но теперь его нужно поместить в секцию hugoblox.ids.
Старый формат:

doi: 10.1038/s41586-023-06900-0

Новый формат:

hugoblox:
  ids:
    doi: 10.1038/s41586-023-06900-0

Аналогично для других идентификаторов (PubMed, arXiv и т.д.):

hugoblox:
  ids:
    doi: 10.1038/s41586-023-06900-0
    pubmed: 12345678
    arxiv: 2301.12345v1

2.2 Скрипт для исправления

Сделал скрипт для исправления (bib-hugoblox-fix.py):

#!/usr/bin/env python

import os
import re
import yaml
from pathlib import Path
import argparse

FIELDS_MAPPING = {
    'doi': 'hugoblox.ids.doi',
    'pubmed': 'hugoblox.ids.pubmed',
    'arxiv': 'hugoblox.ids.arxiv',
    'isbn': 'hugoblox.ids.isbn',
    'pmc': 'hugoblox.ids.pmc',
    'patent': 'hugoblox.ids.patent'
}

def migrate_fields(content):
    yaml_regex = re.compile(r'^---\n(.*?)\n---\n', re.DOTALL)
    match = yaml_regex.search(content)
    if not match:
        return content

    frontmatter = match.group(1)
    data = yaml.safe_load(frontmatter)
    if not data:
        return content

    modified = False
    hugoblox = data.get('hugoblox', {})

    ## Processing regular fields
    for old_field, new_path in FIELDS_MAPPING.items():
        if old_field in data:
            value = data[old_field]
            hugoblox_parts, *path_parts, field_name = new_path.split('.')

            current = hugoblox
            for part in path_parts:
                current = current.setdefault(part, {})

            current[field_name] = value
            del data[old_field]
            modified = True

    ## Processing url_pdf, url_video
    for url_field, link_type in [('url_pdf', 'pdf'), ('url_video', 'video')]:
        if url_field in data:
            url = data[url_field]
            links = hugoblox.get('links', [])

            ## Check if a link of this type exists
            if not any(link.get('type') == link_type for link in links):
                links.append({'type': link_type, 'url': url})
                hugoblox['links'] = links
                modified = True

            del data[url_field]
            modified = True

    if modified:
        ## Merge changes with existing hugoblox
        if 'hugoblox' in data:
            data['hugoblox'].update(hugoblox)
        else:
            data['hugoblox'] = hugoblox

        new_frontmatter = yaml.dump(data, allow_unicode=True, sort_keys=False, width=float("inf"))
        return content.replace(frontmatter, new_frontmatter, 1)

    return content

def process_file(file_path, backup=True):
    with open(file_path, 'r') as f:
        content = f.read()

    new_content = migrate_fields(content)

    if content != new_content:
        if backup:
            backup_path = f"{file_path}.bak"
            Path(file_path).rename(backup_path)

        with open(file_path, 'w') as f:
            f.write(new_content)
        return True
    return False

def process_directory(directory='content/publications/', backup=True):
    modified_files = []

    for root, _, files in os.walk(directory):
        for file in files:
            if file.endswith('.md'):
                full_path = os.path.join(root, file)
                if process_file(full_path, backup):
                    modified_files.append(full_path)

    print(f"Обработано файлов: {len(modified_files)}")
    for path in modified_files:
        print(f" - {path}")

if __name__ == '__main__':
    parser = argparse.ArgumentParser(description="Migrating fields in files Hugo-Blox")
    parser.add_argument('--directory', '-d', default='content/publications/',
                       help='Path to the publication directory')
    parser.add_argument('--no-backup', action='store_false', dest='backup',
                       help='Disable backup')

    args = parser.parse_args()
    process_directory(args.directory, args.backup)

Запуск:

python hugoblox_migrator.py --directory content/my_publications/

Опции:
- --directory : путь к каталогу (по умолчанию: content/publications/);
- --no-backup : отключить создание резервных копий.
Скрипт автоматически обработает все .md файлы в указанной директории и её поддиректориях.

3 Общий скрипт

Мой скрипт для переноса библиографии (scripts/bib.sh):

#!/usr/bin/env bash

# pipx install academic


DIR=$(pwd)

academic import ~/work/bib/bib/mine.bib content/ru/publications --compact --overwrite --verbose

cd ${DIR}/content/en/publications
find . -xtype l -delete
ln -s ../../ru/publications/* .
grep -r russian * | cut -f1 -d":" | xargs -r dirname | xargs -r rm

cd ${DIR}

./scripts/bib-hugoblox-fix.py --directory content/ru/publications/ --no-backup

Обновлено 2026-01-22

Hugo

Authors

Дмитрий Сергеевич Кулябов

Профессор кафедры теории вероятностей и кибербезопасности

Работаю профессором на кафедре теории вероятностей и кибербезопасности Российского университета дружбы народов им. Патриса Лумумбы. Научные интересы относятся к области теоретической физики и математического моделирования.

← Подходы к организации структуры файлов 2025-10-05

Закон Матфея 2025-09-22 →

No results found