std::mbrtowc

ヘッダ `<cwchar>` で定義
`std::size_t mbrtowc( wchar_t* pwc, const char* s, std::size_t n, std::mbstate_t* ps );`

ナローマルチバイト文字をワイド文字に変換します。

s がヌルポインタでなければ、次の完全なマルチバイト文字 (あらゆるシフトシーケンスを含む) を構成するために必要なバイト数を決定するために s の指すバイトから始まるマルチバイト文字列を最大 n バイト調べます。 s 内の次のマルチバイト文字が完全かつ有効であると決定した場合は、それを対応するワイド文字に変換し、 (pwc がヌルでなければ) それを *pwc に格納します。

s がヌルポインタであれば、 n および pwc の値は無視され、その呼び出しは std::mbrtowc(NULL, "", 1, ps) と同等です。

生成されたワイド文字がヌルポインタであれば、 *ps に格納されている変換状態は初期シフト状態になります。

s から変換された (そしてヌルでなければ pwc に格納された) 文字がヌル文字であった場合は 0。
s からの変換に成功したマルチバイト文字のバイト数 [1...n]。
次の n バイトが不完全だけれどもそこまでの部分は有効なマルチバイト文字の場合は static_cast<std::size_t>(-2)。 *pwc には何も書き込まれません。
エンコーディングエラーが発生した場合は static_cast<std::size_t>(-1)。 *pwc には何も書き込まれず、値 EILSEQ が errno に格納され、 *ps の値は未規定になります。

例

Run this code

#include <iostream>
#include <clocale>
#include <cstring>
#include <cwchar>
 
void print_mb(const char* ptr)
{
    std::mbstate_t state = std::mbstate_t(); // initial state
    const char* end = ptr + std::strlen(ptr);
    int len;
    wchar_t wc;
    while((len = std::mbrtowc(&wc, ptr, end-ptr, &state)) > 0) {
        std::wcout << "Next " << len << " bytes are the character " << wc << '\n';
        ptr += len;
    }
}

int main()
{
    std::setlocale(LC_ALL, "en_US.utf8");
    // UTF-8 narrow multibyte encoding
    const char* str = u8"z\u00df\u6c34\U0001d10b"; // or u8"zß水𝄋"
                      // or "\x7a\xc3\x9f\xe6\xb0\xb4\xf0\x9d\x84\x8b";
    print_mb(str);
}

出力:

Next 1 bytes are the character z
Next 2 bytes are the character ß
Next 3 bytes are the character 水
Next 4 bytes are the character 𝄋

pwc	-	結果のワイド文字が書き込まれる位置を指すポインタ
s	-	入力として使用されるマルチバイト文字列を指すポインタ
n	-	調べる s のバイト数の制限
ps	-	マルチバイト文字列を解釈するとき使用される変換状態を指すポインタ

mbtowc	次のマルチバイト文字をワイド文字に変換します (関数) [edit]
wcrtomb	指定された状態を使用してワイド文字をマルチバイト表現に変換します (関数) [edit]
do_in [仮想]	ファイルから読み込む時などのために、文字列を externT から internT に変換します (`std::codecvt<InternT,ExternT,State>`の仮想プロテクテッドメンバ関数) [edit]
mbrtowc の C言語リファレンス

cppreference.com

検索

名前空間

変種

表示

操作

std::mbrtowc

目次

引数

戻り値

例

関連項目

案内

ツール