はてなブログからエクスポートした記事をAstro Blog用のマークダウン形式に変換する


Why

はてなブログで作成した過去の記事データをAstroを使用した個人のブログに移行したい。

What

はてなブログの記事データは MT 形式の txt ファイルとして出力される。

Astro の Blog テンプレートでは/src/content/blog 以下のマークダウン形式のファイルをページとして扱うことができる。

エクスポートした hoge.export.txt ファイルを/src/content/blog 以下の.md ファイル群に変換する Python のスクリプトを作成した。

import os

def convert_article(input_file):
    with open(input_file, 'r', encoding='utf-8') as f:
        lines = f.readlines()

    articles = []
    current_article = []

    for line in lines:
        if line.strip() == '--------':
            if current_article:
                articles.append(current_article.copy())
                current_article.clear()
        else:
            current_article.append(line)

    if current_article:
        articles.append(current_article)

    for article in articles:
        basename = ""
        categories = []
        author = ""
        title = ""
        date = ""
        image = ""
        body = ""
        for line in article:
            if line.startswith('AUTHOR:'):
                author = line.split(': ')[1].strip()
            elif line.startswith('TITLE:'):
                title = line.split(': ')[1].strip()
            elif line.startswith('BASENAME:'):
                basename = line.split(': ')[1].strip().replace('/', '-')
            elif line.startswith('DATE:'):
                date = line.split(': ')[1].strip()
            elif line.startswith('CATEGORY:'):
                category = line.split(': ')[1].strip()
                categories.append(category)
            elif line.startswith('IMAGE:'):
                image = line.split(': ')[1].strip()
            elif line.startswith('-----'):
                pass
            elif line.startswith('STATUS:'):
                pass
            elif line.startswith('ALLOW COMMENTS:'):
                pass
            elif line.startswith('CONVERT BREAKS:'):
                pass
            elif line.startswith('BODY:'):
                pass
            else:
                body += line
        image = image or '""'
        content = "---\n" + f"author: {author}\n" + f"title: {title}\n" + f"pubDate: {date}\n" + f"category: {categories}\n" + f"heroImage: {image}\n" + "---\n" + body
        dirname = os.path.dirname(basename)
        if dirname:
            os.makedirs("src/content/blog"+dirname, exist_ok=True)
        with open(f"src/content/blog/{basename}.md", 'w', encoding='utf-8') as f:
            f.write(content)

convert_article('hoge.export.txt')