std::mbrtowc
提供: cppreference.com
<tbody>
</tbody>
| ヘッダ <cwchar> で定義
|
||
std::size_t mbrtowc( wchar_t* pwc, const char* s, std::size_t n, std::mbstate_t* ps ); |
||
ナローマルチバイト文字をワイド文字に変換します。
s がヌルポインタでなければ、次の完全なマルチバイト文字 (あらゆるシフトシーケンスを含む) を構成するために必要なバイト数を決定するために s の指すバイトから始まるマルチバイト文字列を最大 n バイト調べます。 s 内の次のマルチバイト文字が完全かつ有効であると決定した場合は、それを対応するワイド文字に変換し、 (pwc がヌルでなければ) それを *pwc に格納します。
s がヌルポインタであれば、 n および pwc の値は無視され、その呼び出しは std::mbrtowc(NULL, "", 1, ps) と同等です。
生成されたワイド文字がヌルポインタであれば、 *ps に格納されている変換状態は初期シフト状態になります。
引数
| pwc | - | 結果のワイド文字が書き込まれる位置を指すポインタ |
| s | - | 入力として使用されるマルチバイト文字列を指すポインタ |
| n | - | 調べる s のバイト数の制限 |
| ps | - | マルチバイト文字列を解釈するとき使用される変換状態を指すポインタ |
戻り値
以下のうち最初に適用されるものが返されます。
sから変換された (そしてヌルでなければpwcに格納された) 文字がヌル文字であった場合は0。sからの変換に成功したマルチバイト文字のバイト数[1...n]。- 次の
nバイトが不完全だけれどもそこまでの部分は有効なマルチバイト文字の場合はstatic_cast<std::size_t>(-2)。*pwcには何も書き込まれません。 - エンコーディングエラーが発生した場合は
static_cast<std::size_t>(-1)。*pwcには何も書き込まれず、値 EILSEQ が errno に格納され、*psの値は未規定になります。
例
Run this code
#include <iostream>
#include <clocale>
#include <cstring>
#include <cwchar>
void print_mb(const char* ptr)
{
std::mbstate_t state = std::mbstate_t(); // initial state
const char* end = ptr + std::strlen(ptr);
int len;
wchar_t wc;
while((len = std::mbrtowc(&wc, ptr, end-ptr, &state)) > 0) {
std::wcout << "Next " << len << " bytes are the character " << wc << '\n';
ptr += len;
}
}
int main()
{
std::setlocale(LC_ALL, "en_US.utf8");
// UTF-8 narrow multibyte encoding
const char* str = u8"z\u00df\u6c34\U0001d10b"; // or u8"zß水𝄋"
// or "\x7a\xc3\x9f\xe6\xb0\xb4\xf0\x9d\x84\x8b";
print_mb(str);
}
出力:
Next 1 bytes are the character z
Next 2 bytes are the character ß
Next 3 bytes are the character 水
Next 4 bytes are the character 𝄋
関連項目
| 次のマルチバイト文字をワイド文字に変換します (関数) | |
| 指定された状態を使用してワイド文字をマルチバイト表現に変換します (関数) | |
[仮想] |
ファイルから読み込む時などのために、文字列を externT から internT に変換します ( std::codecvt<InternT,ExternT,State>の仮想プロテクテッドメンバ関数)
|
mbrtowc の C言語リファレンス
|