新聞中心
Character

java.lang.Object
|---java.lang.Character
public final class Character
extends Object
implements Serializable, ComparableCharacter 類將原始類型 char 的值包裝在一個(gè)對象中。 Character 類的對象包含一個(gè)類型為 char 的字段。
此外,該類提供了大量靜態(tài)方法,用于確定字符的類別(小寫字母、數(shù)字等)以及將字符從大寫字母轉(zhuǎn)換為小寫字母,反之亦然。
Unicode 一致性
Character 類的字段和方法是根據(jù) Unicode 標(biāo)準(zhǔn)中的字符信息定義的,特別是作為 Unicode 字符數(shù)據(jù)庫一部分的 UnicodeData 文件。此文件為每個(gè)分配的 Unicode 代碼點(diǎn)或字符范圍指定屬性,包括名稱和類別。該文件可從 Unicode 聯(lián)盟 http://www.unicode.org 獲得。
Java SE 8 平臺使用來自 Unicode 標(biāo)準(zhǔn) 6.2 版的字符信息,帶有兩個(gè)擴(kuò)展。首先,Java SE 8 平臺允許類 Character 的實(shí)現(xiàn)使用日本時(shí)代的代碼點(diǎn) U+32FF,從 6.2 之后分配代碼點(diǎn)的 Unicode 標(biāo)準(zhǔn)的第一個(gè)版本開始。其次,鑒于新貨幣頻繁出現(xiàn)這一事實(shí),Java SE 8 平臺允許類 Character 的實(shí)現(xiàn)使用 Unicode 標(biāo)準(zhǔn) 10.0 版中的貨幣符號塊。因此,在處理上述代碼點(diǎn)(版本 6.2 之外)時(shí),Character 類的字段和方法的行為可能會(huì)因 Java SE 8 平臺的實(shí)現(xiàn)而異,但以下定義 Java 標(biāo)識符的方法除外:isJavaIdentifierStart(int)、isJavaIdentifierStart (char)、isJavaIdentifierPart(int) 和 isJavaIdentifierPart(char)。 Java 標(biāo)識符中的代碼點(diǎn)必須取自 Unicode 標(biāo)準(zhǔn) 6.2 版。
Unicode 字符表示
char 數(shù)據(jù)類型(以及因此 Character 對象封裝的值)基于原始 Unicode 規(guī)范,該規(guī)范將字符定義為固定寬度的 16 位實(shí)體。此后,Unicode 標(biāo)準(zhǔn)已更改為允許表示需要超過 16 位的字符。合法代碼點(diǎn)的范圍現(xiàn)在是 U+0000 到 U+10FFFF,稱為 Unicode 標(biāo)量值。 (請參閱 Unicode 標(biāo)準(zhǔn)中 U+n 符號的定義。)
從 U+0000 到 U+FFFF 的字符集有時(shí)稱為基本多語言平面 (BMP)。碼位大于 U+FFFF 的字符稱為補(bǔ)充字符。 Java 平臺在 char 數(shù)組以及 String 和 StringBuffer 類中使用 UTF-16 表示。在此表示中,補(bǔ)充字符表示為一對 char 值,第一個(gè)來自高代理范圍 (\uD800-\uDBFF),第二個(gè)來自低代理范圍 (\uDC00-\uDFFF)。
因此,char 值表示基本多語言平面 (BMP) 代碼點(diǎn),包括代理代碼點(diǎn)或 UTF-16 編碼的代碼單元。一個(gè) int 值表示所有 Unicode 代碼點(diǎn),包括補(bǔ)充代碼點(diǎn)。 int 的低(最低)21 位用于表示 Unicode 代碼點(diǎn),高(最高)11 位必須為零。除非另有說明,關(guān)于補(bǔ)充字符和代理字符值的行為如下:
- 只接受 char 值的方法不支持補(bǔ)充字符。 它們將代理范圍中的 char 值視為未定義字符。 例如,Character.isLetter('\uD840') 返回 false,即使此特定值后跟字符串中的任何低代理值將表示一個(gè)字母。
- 接受 int 值的方法支持所有 Unicode 字符,包括補(bǔ)充字符。 例如,Character.isLetter(0x2F81A) 返回 true,因?yàn)榇a點(diǎn)值表示一個(gè)字母(CJK 表意文字)。
在 Java SE API 文檔中,Unicode 代碼點(diǎn)用于 U+0000 到 U+10FFFF 范圍內(nèi)的字符值,Unicode 代碼單元用于 16 位字符值,即 UTF-16 編碼的代碼單元。
嵌套類摘要
| 修飾符和類型 | 類 | 描述 |
|---|---|---|
| static class | Character.Subset | 此類的實(shí)例表示 Unicode 字符集的特定子集。 |
| static class | Character.UnicodeBlock | 表示 Unicode 規(guī)范中字符塊的字符子集系列。 |
| static class | Character.UnicodeScript | 表示 Unicode 標(biāo)準(zhǔn)附件 #24:腳本名稱中定義的字符腳本的字符子集系列。 |
字段摘要
| 修飾符和類型 | 字段 | 描述 |
|---|---|---|
| static int | BYTES | 用于以無符號二進(jìn)制形式表示 char 值的字節(jié)數(shù)。 |
| static byte | COMBINING_SPACING_MARK | Unicode 規(guī)范中的通用類別“Mc”。 |
| static byte | CONNECTOR_PUNCTUATION | Unicode 規(guī)范中的通用類別“Pc”。 |
| static byte | CONTROL | Unicode 規(guī)范中的通用類別“Cc”。 |
| static byte | CURRENCY_SYMBOL | Unicode 規(guī)范中的通用類別“Sc”。 |
| static byte | DASH_PUNCTUATION | Unicode 規(guī)范中的通用類別“Pd”。 |
| static byte | DECIMAL_DIGIT_NUMBER | Unicode 規(guī)范中的通用類別“Nd”。 |
| static byte | DIRECTIONALITY_ARABIC_NUMBER | Unicode 規(guī)范中的弱雙向字符類型“AN”。 |
| static byte | DIRECTIONALITY_BOUNDARY_NEUTRAL | Unicode 規(guī)范中的弱雙向字符類型“BN”。 |
| static byte | DIRECTIONALITY_COMMON_NUMBER_SEPARATOR | Unicode 規(guī)范中的弱雙向字符類型“CS”。 |
| static byte | DIRECTIONALITY_EUROPEAN_NUMBER | Unicode 規(guī)范中的弱雙向字符類型“EN”。 |
| static byte | DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR | Unicode 規(guī)范中的弱雙向字符類型“ES”。 |
| static byte | DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR | Unicode 規(guī)范中的弱雙向字符類型“ET”。 |
| static byte | DIRECTIONALITY_LEFT_TO_RIGHT | Unicode 規(guī)范中的強(qiáng)雙向字符類型“L”。 |
| static byte | DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING | Unicode 規(guī)范中的強(qiáng)雙向字符類型“LRE”。 |
| static byte | DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE | Unicode 規(guī)范中的強(qiáng)雙向字符類型“LRO”。 |
| static byte | DIRECTIONALITY_NONSPACING_MARK | Unicode 規(guī)范中的弱雙向字符類型“NSM”。 |
| static byte | DIRECTIONALITY_OTHER_NEUTRALS | Unicode 規(guī)范中的中性雙向字符類型“ON”。 |
| static byte | DIRECTIONALITY_PARAGRAPH_SEPARATOR | Unicode 規(guī)范中的中性雙向字符類型“B”。 |
| static byte | DIRECTIONALITY_POP_DIRECTIONAL_FORMAT | Unicode 規(guī)范中的弱雙向字符類型“PDF”。 |
| static byte | DIRECTIONALITY_RIGHT_TO_LEFT | Unicode 規(guī)范中的強(qiáng)雙向字符類型“R”。 |
| static byte | DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC | Unicode 規(guī)范中的強(qiáng)雙向字符類型“AL”。 |
| static byte | DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING | Unicode 規(guī)范中的強(qiáng)雙向字符類型“RLE”。 |
| static byte | DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE | Unicode 規(guī)范中的強(qiáng)雙向字符類型“RLO”。 |
| static byte | DIRECTIONALITY_SEGMENT_SEPARATOR | Unicode 規(guī)范中的中性雙向字符類型“S”。 |
| static byte | DIRECTIONALITY_UNDEFINED | 未定義的雙向字符類型。 |
| static byte | DIRECTIONALITY_WHITESPACE | Unicode 規(guī)范中的中性雙向字符類型“WS”。 |
| static byte | ENCLOSING_MARK | Unicode 規(guī)范中的通用類別“Me”。 |
| static byte | END_PUNCTUATION | Unicode 規(guī)范中的通用類別“Pe”。 |
| static byte | FINAL_QUOTE_PUNCTUATION | Unicode 規(guī)范中的通用類別“Pf”。 |
| static byte | FORMAT | Unicode 規(guī)范中的通用類別“Cf”。 |
| static byte | INITIAL_QUOTE_PUNCTUATION | Unicode 規(guī)范中的通用類別“Pi”。 |
| static byte | LETTER_NUMBER | Unicode 規(guī)范中的通用類別“Nl”。 |
| static byte | LINE_SEPARATOR | Unicode 規(guī)范中的通用類別“Zl”。 |
| static byte | LOWERCASE_LETTER | Unicode 規(guī)范中的通用類別“Ll”。 |
| static byte | MATH_SYMBOL | Unicode 規(guī)范中的通用類別“Sm”。 |
| static int | MAX_CODE_POINT | Unicode 碼位的最大值,常量 U+10FFFF。 |
| static char | MAX_HIGH_SURROGATE | UTF-16 編碼中 Unicode 高代理代碼單元的最大值,常量 '\uDBFF'。 |
| static char | MAX_LOW_SURROGATE | UTF-16 編碼中 Unicode 低代理代碼單元的最大值,常量 '\uDFFF'。 |
| static int | MAX_RADIX | 可用于與字符串相互轉(zhuǎn)換的最大基數(shù)。 |
| static char | MAX_SURROGATE | UTF-16 編碼中 Unicode 代理代碼單元的最大值,常量 '\uDFFF'。 |
| static char | MAX_VALUE | 該字段的常量值是 char 類型的最大值,'\uFFFF'。 |
| static int | MIN_CODE_POINT | Unicode 代碼點(diǎn)的最小值,常量 U+0000。 |
| static char | MIN_HIGH_SURROGATE | UTF-16 編碼中 Unicode 高代理代碼單元的最小值,常量 '\uD800'。 |
| static char | MIN_LOW_SURROGATE | UTF-16 編碼中 Unicode 低代理代碼單元的最小值,常量 '\uDC00'。 |
| static int | MIN_RADIX | 可用于與字符串相互轉(zhuǎn)換的最小基數(shù)。 |
| static int | MIN_SUPPLEMENTARY_CODE_POINT | Unicode 補(bǔ)充碼點(diǎn)的最小值,常數(shù) U+10000。 |
| static char | MIN_SURROGATE | UTF-16 編碼中 Unicode 代理代碼單元的最小值,常量 '\uD800'。 |
| static char | MIN_VALUE | 該字段的常數(shù)值是 char 類型的最小值,'\u0000'。 |
| static byte | MODIFIER_LETTER | Unicode 規(guī)范中的通用類別“Lm”。 |
| static byte | MODIFIER_SYMBOL | Unicode 規(guī)范中的通用類別“Sk”。 |
| static byte | NON_SPACING_MARK | Unicode 規(guī)范中的通用類別“Mn”。 |
| static byte | OTHER_LETTER | Unicode 規(guī)范中的通用類別“Lo”。 |
| static byte | OTHER_NUMBER | Unicode 規(guī)范中的通用類別“No”。 |
| static byte | OTHER_PUNCTUATION | Unicode 規(guī)范中的通用類別“Po”。 |
| static byte | OTHER_SYMBOL | Unicode 規(guī)范中的一般類別“So”。 |
| static byte | PARAGRAPH_SEPARATOR | Unicode 規(guī)范中的通用類別“Zp”。 |
| static byte | PRIVATE_USE | Unicode 規(guī)范中的通用類別“Co”。 |
| static int | SIZE | 用于以無符號二進(jìn)制形式表示 char 值的位數(shù),常量 16。 |
| static byte | SPACE_SEPARATOR | Unicode 規(guī)范中的通用類別“Zs”。 |
| static byte | START_PUNCTUATION | Unicode 規(guī)范中的通用類別“Ps”。 |
| static byte | SURROGATE | Unicode 規(guī)范中的通用類別“Cs”。 |
| static byte | TITLECASE_LETTER | Unicode 規(guī)范中的通用類別“Lt”。 |
| static ClassCharacter | TYPE | 表示基本類型 char 的 Class 實(shí)例。 |
| static byte | UNASSIGNED | Unicode 規(guī)范中的通用類別“Cn”。 |
| static byte | UPPERCASE_LETTER | Unicode 規(guī)范中的通用類別“Lu”。 |
構(gòu)造函數(shù)摘要
| 構(gòu)造函數(shù) | 描述 |
|---|---|
| Character(char value) | 構(gòu)造一個(gè)新分配的 Character 對象,該對象表示指定的 char 值。 |
方法總結(jié)
| 修飾符和類型 | 方法 | 描述 |
|---|---|---|
| static int | charCount(int codePoint) | 確定表示指定字符(Unicode 代碼點(diǎn))所需的 char 值的數(shù)量。 |
| char | charValue() | 返回此 Character 對象的值。 |
| static int | codePointAt(char[] a, int index) | 返回 char 數(shù)組給定索引處的代碼點(diǎn)。 |
| static int | codePointAt(char[] a, int index, int limit) | 返回 char 數(shù)組給定索引處的代碼點(diǎn),其中只能使用索引小于限制的數(shù)組元素。 |
| static int | codePointAt(CharSequence seq, int index) | 返回 CharSequence 的給定索引處的代碼點(diǎn)。 |
| static int | codePointBefore(char[] a, int index) | 返回 char 數(shù)組的給定索引之前的代碼點(diǎn)。 |
| static int | codePointBefore(char[] a, int index, int start) | 返回 char 數(shù)組的給定索引之前的代碼點(diǎn),其中只能使用索引大于或等于 start 的數(shù)組元素。 |
| static int | codePointBefore(CharSequence seq, int index) | 返回 CharSequence 的給定索引之前的代碼點(diǎn)。 |
| static int | codePointCount(char[] a, int offset, int count) | 返回 char 數(shù)組參數(shù)的子數(shù)組中的 Unicode 代碼點(diǎn)數(shù)。 |
| static int | codePointCount(CharSequence seq, int beginIndex, int endIndex) | 返回指定字符序列的文本范圍內(nèi)的 Unicode 代碼點(diǎn)數(shù)。 |
| static int | compare(char x, char y) | 以數(shù)字方式比較兩個(gè) char 值。 |
| int | compareTo(Character anotherCharacter) | 以數(shù)字方式比較兩個(gè) Character 對象。 |
| static int | digit(char ch, int radix) | 返回指定基數(shù)中字符 ch 的數(shù)值。 |
| static int | digit(int codePoint, int radix) | 返回指定基數(shù)中指定字符(Unicode 代碼點(diǎn))的數(shù)值。 |
| boolean | equals(Object obj) | 將此對象與指定對象進(jìn)行比較。 |
| static char | forDigit(int digit, int radix) | 確定指定基數(shù)中特定數(shù)字的字符表示。 |
| static byte | getDirectionality(char ch) | 返回給定字符的 Unicode 方向性屬性。 |
| static byte | getDirectionality(int codePoint) | 返回給定字符(Unicode 代碼點(diǎn))的 Unicode 方向性屬性。 |
| static String | getName(int codePoint) | 返回指定字符代碼點(diǎn)的 Unicode 名稱,如果代碼點(diǎn)未分配,則返回 null。 |
| static int | getNumericValue(char ch) | 返回指定 Unicode 字符表示的 int 值。 |
| static int | getNumericValue(int codePoint) | 返回指定字符(Unicode 代碼點(diǎn))表示的 int 值。 |
| static int | getType(char ch) | 返回一個(gè)值,指示字符的一般類別。 |
| static int | getType(int codePoint) | 返回一個(gè)值,指示字符的一般類別。 |
| int | hashCode() | 返回此字符的哈希碼; 等于調(diào)用 charValue() 的結(jié)果。 |
| static int | hashCode(char value) | 返回 char 值的哈希碼; 與 Character.hashCode() 兼容。 |
| static char | highSurrogate(int codePoint) | 返回以 UTF-16 編碼表示指定補(bǔ)充字符(Unicode 代碼點(diǎn))的代理項(xiàng)對的前導(dǎo)代理項(xiàng)(高代理項(xiàng)代碼單元)。 |
| static boolean | isAlphabetic(int codePoint) | 確定指定字符(Unicode 代碼點(diǎn))是否為字母表。 |
| static boolean | isBmpCodePoint(int codePoint) | 確定指定字符(Unicode 代碼點(diǎn))是否在基本多語言平面 (BMP) 中。 |
| static boolean | isDefined(char ch) | 確定字符是否以 Unicode 定義。 |
| static boolean | isDefined(int codePoint) | 確定字符(Unicode 代碼點(diǎn))是否以 Unicode 定義。 |
| static boolean | isDigit(char ch) | 確定指定的字符是否為數(shù)字。 |
| static boolean | isDigit(int codePoint) | 確定指定的字符(Unicode 代碼點(diǎn))是否為數(shù)字。 |
| static boolean | isHighSurrogate(char ch) | 確定給定的 char 值是否是 Unicode 高代理代碼單元(也稱為前導(dǎo)代理代碼單元)。 |
| static boolean | isIdentifierIgnorable(char ch) | 確定是否應(yīng)將指定字符視為 Java 標(biāo)識符或 Unicode 標(biāo)識符中的可忽略字符。 |
| static boolean | isIdentifierIgnorable(int codePoint) | 確定是否應(yīng)將指定字符(Unicode 代碼點(diǎn))視為 Java 標(biāo)識符或 Unicode 標(biāo)識符中的可忽略字符。 |
| static boolean | isIdeographic(int codePoint) | 確定指定字符(Unicode 代碼點(diǎn))是否為 Unicode 標(biāo)準(zhǔn)定義的 CJKV(中文、日文、韓文和越南文)表意文字。 |
| static boolean | isISOControl(char ch) | 確定指定字符是否為 ISO 控制字符。 |
| static boolean | isISOControl(int codePoint) | 確定引用的字符(Unicode 代碼點(diǎn))是否為 ISO 控制字符。 |
| static boolean | isJavaIdentifierPart(char ch) | 確定指定字符是否可以是 Java 標(biāo)識符的一部分,而不是第一個(gè)字符。 |
| static boolean | isJavaIdentifierPart(int codePoint) | 確定字符(Unicode 代碼點(diǎn))是否可以是 Java 標(biāo)識符的一部分,而不是第一個(gè)字符。 |
| static boolean | isJavaIdentifierStart(char ch) | 確定指定的字符是否允許作為 Java 標(biāo)識符中的第一個(gè)字符。 |
| static boolean | isJavaIdentifierStart(int codePoint) | 確定字符(Unicode 代碼點(diǎn))是否允許作為 Java 標(biāo)識符中的第一個(gè)字符。 |
| static boolean | isJavaLetter(char ch) | 已棄用。 替換為 isJavaIdentifierStart(char)。 |
| static boolean | isJavaLetterOrDigit(char ch) | 已棄用。 替換為 isJavaIdentifierPart(char)。 |
| static boolean | isLetter(char ch) | 確定指定的字符是否為字母。 |
| static boolean | isLetter(int codePoint) | 確定指定字符(Unicode 代碼點(diǎn))是否為字母。 |
| static boolean | isLetterOrDigit(char ch) | 確定指定的字符是字母還是數(shù)字。 |
| static boolean | isLetterOrDigit(int codePoint) | 確定指定的字符(Unicode 代碼點(diǎn))是字母還是數(shù)字。 |
| static boolean | isLowerCase(char ch) | 確定指定字符是否為小寫字符。 |
| static boolean | isLowerCase(int codePoint) | 確定指定字符(Unicode 代碼點(diǎn))是否為小寫字符。 |
| static boolean | isLowSurrogate(char ch) | 確定給定的 char 值是否是 Unicode 低代理代碼單元(也稱為尾隨代理代碼單元)。 |
| static boolean | isMirrored(char ch) | 確定字符是否根據(jù) Unicode 規(guī)范進(jìn)行鏡像。 |
| static boolean | isMirrored(int codePoint) | 確定是否根據(jù) Unicode 規(guī)范鏡像指定的字符(Unicode 代碼點(diǎn))。 |
| static boolean | isSpace(char ch) | 已棄用。 替換為 isWhitespace(char)。 |
| static boolean | isSpaceChar(char ch) | 確定指定字符是否為 Unicode 空格字符。 |
| static boolean | isSpaceChar(int codePoint) | 確定指定字符(Unicode 代碼點(diǎn))是否為 Unicode 空格字符。 |
| static boolean | isSupplementaryCodePoint(int codePoint) | 確定指定字符(Unicode 代碼點(diǎn))是否在補(bǔ)充字符范圍內(nèi)。 |
| static boolean | isSurrogate(char ch) | 確定給定的 char 值是否是 Unicode 代理代碼單元。 |
| static boolean | isSurrogatePair(char high, char low) | 確定指定的 char 值對是否為有效的 Unicode 代理項(xiàng)對。 |
| static boolean | isTitleCase(char ch) | 確定指定的字符是否為標(biāo)題字符。 |
| static boolean | isTitleCase(int codePoint) | 確定指定字符(Unicode 代碼點(diǎn))是否為標(biāo)題字符。 |
| static boolean | isUnicodeIdentifierPart(char ch) | 確定指定字符是否可以是 Unicode 標(biāo)識符的一部分,而不是第一個(gè)字符。 |
| static boolean | isUnicodeIdentifierPart(int codePoint) | 確定指定字符(Unicode 代碼點(diǎn))是否可以是 Unicode 標(biāo)識符的一部分,而不是第一個(gè)字符。 |
| static boolean | isUnicodeIdentifierStart(char ch) | 確定指定字符是否允許作為 Unicode 標(biāo)識符中的第一個(gè)字符。 |
| static boolean | isUnicodeIdentifierStart(int codePoint) | 確定指定的字符(Unicode 代碼點(diǎn))是否允許作為 Unicode 標(biāo)識符中的第一個(gè)字符。 |
| static boolean | isUpperCase(char ch) | 確定指定字符是否為大寫字符。 |
| static boolean | isUpperCase(int codePoint) | 確定指定字符(Unicode 代碼點(diǎn))是否為大寫字符。 |
| static boolean | isValidCodePoint(int codePoint) | 確定指定的代碼點(diǎn)是否是有效的 Unicode 代碼點(diǎn)值。 |
| static boolean | isWhitespace(char ch) | 根據(jù) Java 確定指定字符是否為空格。 |
| static boolean | isWhitespace(int codePoint) | 根據(jù) Java 確定指定字符(Unicode 代碼點(diǎn))是否為空格。 |
| static char | lowSurrogate(int codePoint) | 返回以 UTF-16 編碼表示指定補(bǔ)充字符(Unicode 代碼點(diǎn))的代理項(xiàng)對的尾隨代理項(xiàng)(低代理項(xiàng)代碼單元)。 |
| static int | offsetByCodePoints(char[] a, int start, int count, int index, int codePointOffset) | 返回給定 char 子數(shù)組中從給定索引偏移 codePointOffset 代碼點(diǎn)的索引。 |
| static int | offsetByCodePoints(CharSequence seq, int index, int codePointOffset) | 返回給定 char 序列中的索引,該索引與給定索引偏移 codePointOffset 代碼點(diǎn)。 |
| static char | reverseBytes(char ch) | 返回通過反轉(zhuǎn)指定 char 值中的字節(jié)順序獲得的值。 |
| static char[] | toChars(int codePoint) | 將指定字符(Unicode 代碼點(diǎn))轉(zhuǎn)換為存儲在 char 數(shù)組中的 UTF-16 表示形式。 |
| static int | toChars(int codePoint, char[] dst, int dstIndex) | 將指定的字符(Unicode 代碼點(diǎn))轉(zhuǎn)換為其 UTF-16 表示。 |
| static int | toCodePoint(char high, char low) | 將指定的代理對轉(zhuǎn)換為其補(bǔ)充代碼點(diǎn)值。 |
| static char | toLowerCase(char ch) | 使用 UnicodeData 文件中的大小寫映射信息將字符參數(shù)轉(zhuǎn)換為小寫。 |
| static int | toLowerCase(int codePoint) | 使用 UnicodeData 文件中的大小寫映射信息將字符(Unicode 代碼點(diǎn))參數(shù)轉(zhuǎn)換為小寫。 |
| String | toString() | 返回一個(gè)表示此 Character 值的 String 對象。 |
| static String | toString(char c) | 返回表示指定字符的 String 對象。 |
| static char | toTitleCase(char ch) | 使用 UnicodeData 文件中的大小寫映射信息將字符參數(shù)轉(zhuǎn)換為標(biāo)題大小寫。 |
| static int | toTitleCase(int codePoint) | 使用 UnicodeData 文件中的大小寫映射信息將字符(Unicode 代碼點(diǎn))參數(shù)轉(zhuǎn)換為標(biāo)題大小寫。 |
| static char | toUpperCase(char ch) | 使用 UnicodeData 文件中的大小寫映射信息將字符參數(shù)轉(zhuǎn)換為大寫。 |
| static int | toUpperCase(int codePoint) | 使用 UnicodeData 文件中的大小寫映射信息將字符(Unicode 代碼點(diǎn))參數(shù)轉(zhuǎn)換為大寫。 |
| static Character | valueOf(char c) | 返回表示指定 char 值的 Character 實(shí)例。 |
| 從類 java.lang.Object 繼承的方法 |
|---|
| clone, finalize, getClass, notify, notifyAll, wait, wait, wait |
字段詳細(xì)信息
BYTES
public static final int BYTES
用于以無符號二進(jìn)制形式表示 char 值的字節(jié)數(shù)。
COMBINING_SPACING_MARK
public static final byte COMBINING_SPACING_MARK
Unicode 規(guī)范中的通用類別“Mc”。
CONNECTOR_PUNCTUATION
public static final byte CONNECTOR_PUNCTUATION
Unicode 規(guī)范中的通用類別“Pc”。
CONTROL
public static final byte CONTROL
Unicode 規(guī)范中的通用類別“Cc”。
CURRENCY_SYMBOL
public static final byte CURRENCY_SYMBOL
Unicode 規(guī)范中的通用類別“Sc”。
DASH_PUNCTUATION
public static final byte DASH_PUNCTUATION
Unicode 規(guī)范中的通用類別“Pd”。
DECIMAL_DIGIT_NUMBER
public static final byte DECIMAL_DIGIT_NUMBER
Unicode 規(guī)范中的通用類別“Nd”。
DIRECTIONALITY_ARABIC_NUMBER
public static final byte DIRECTIONALITY_ARABIC_NUMBER
Unicode 規(guī)范中的弱雙向字符類型“AN”。
DIRECTIONALITY_BOUNDARY_NEUTRAL
public static final byte DIRECTIONALITY_BOUNDARY_NEUTRAL
Unicode 規(guī)范中的弱雙向字符類型“BN”。
DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
public static final byte DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
Unicode 規(guī)范中的弱雙向字符類型“CS”。
DIRECTIONALITY_EUROPEAN_NUMBER
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER
Unicode 規(guī)范中的弱雙向字符類型“EN”。
DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
Unicode 規(guī)范中的弱雙向字符類型“ES”。
DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
Unicode 規(guī)范中的弱雙向字符類型“ET”。
DIRECTIONALITY_LEFT_TO_RIGHT
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT
Unicode 規(guī)范中的強(qiáng)雙向字符類型“L”。
DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
Unicode 規(guī)范中的強(qiáng)雙向字符類型“LRE”。
DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
Unicode 規(guī)范中的強(qiáng)雙向字符類型“LRO”。
DIRECTIONALITY_NONSPACING_MARK
public static final byte DIRECTIONALITY_NONSPACING_MARK
Unicode 規(guī)范中的弱雙向字符類型“NSM”。
DIRECTIONALITY_OTHER_NEUTRALS
public static final byte DIRECTIONALITY_OTHER_NEUTRALS
Unicode 規(guī)范中的中性雙向字符類型“ON”。
DIRECTIONALITY_PARAGRAPH_SEPARATOR
public static final byte DIRECTIONALITY_PARAGRAPH_SEPARATOR
Unicode 規(guī)范中的中性雙向字符類型“B”。
DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
public static final byte DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
Unicode 規(guī)范中的弱雙向字符類型“PDF”。
DIRECTIONALITY_RIGHT_TO_LEFT
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT
Unicode 規(guī)范中的強(qiáng)雙向字符類型“R”。
DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
Unicode 規(guī)范中的強(qiáng)雙向字符類型“AL”。
DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
Unicode 規(guī)范中的強(qiáng)雙向字符類型“RLE”。
DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
Unicode 規(guī)范中的強(qiáng)雙向字符類型“RLO”。
DIRECTIONALITY_SEGMENT_SEPARATOR
public static final byte DIRECTIONALITY_SEGMENT_SEPARATOR
Unicode 規(guī)范中的中性雙向字符類型“S”。
DIRECTIONALITY_UNDEFINED
public static final byte DIRECTIONALITY_UNDEFINED
未定義的雙向字符類型。 未定義的 char 值在 Unicode 規(guī)范中具有未定義的方向性。
DIRECTIONALITY_WHITESPACE
public static final byte DIRECTIONALITY_WHITESPACE
Unicode 規(guī)范中的中性雙向字符類型“WS”。
ENCLOSING_MARK
public static final byte ENCLOSING_MARK
Unicode 規(guī)范中的通用類別“Me”。
END_PUNCTUATION
public static final byte END_PUNCTUATION
Unicode 規(guī)范中的通用類別“Pe”。
FINAL_QUOTE_PUNCTUATION
public static final byte FINAL_QUOTE_PUNCTUATION
Unicode 規(guī)范中的通用類別“Pf”。
FORMAT
public static final byte FORMAT
Unicode 規(guī)范中的通用類別“Cf”。
INITIAL_QUOTE_PUNCTUATION
public static final byte INITIAL_QUOTE_PUNCTUATION
Unicode 規(guī)范中的通用類別“Pi”。
LETTER_NUMBER
public static final byte LETTER_NUMBER
Unicode 規(guī)范中的通用類別“Nl”。
LINE_SEPARATOR
public static final byte LINE_SEPARATOR
Unicode 規(guī)范中的通用類別“Zl”。
LOWERCASE_LETTER
public static final byte LOWERCASE_LETTER
Unicode 規(guī)范中的通用類別“Ll”。
MATH_SYMBOL
public static final byte MATH_SYMBOL
Unicode 規(guī)范中的通用類別“Sm”。
MAX_CODE_POINT
public static final int MAX_CODE_POINT
Unicode 碼位的最大值,常量 U+10FFFF。
MAX_HIGH_SURROGATE
public static final char MAX_HIGH_SURROGATE
UTF-16 編碼中 Unicode 高代理代碼單元的最大值,常量 '\uDBFF'。 高代理也稱為領(lǐng)先代理。
MAX_LOW_SURROGATE
public static final char MAX_LOW_SURROGATE
UTF-16 編碼中 Unicode 低代理代碼單元的最大值,常量 '\uDFFF'。 低代理也稱為尾隨代理。
MAX_RADIX
public static final int MAX_RADIX
可用于與字符串相互轉(zhuǎn)換的最大基數(shù)。 該字段的常數(shù)值是基數(shù)轉(zhuǎn)換方法(例如 digit 方法、forDigit 方法和 Integer 類的 toString 方法)中基數(shù)參數(shù)允許的最大值。
MAX_SURROGATE
public static final char MAX_SURROGATE
UTF-16 編碼中 Unicode 代理代碼單元的最大值,常量 '\uDFFF'。
MAX_VALUE
public static final char MAX_VALUE
該字段的常量值是 char 類型的最大值,'\uFFFF'。
MIN_CODE_POINT
public static final int MIN_CODE_POINT
Unicode 代碼點(diǎn)的最小值,常量 U+0000。
MIN_HIGH_SURROGATE
public static final char MIN_HIGH_SURROGATE
UTF-16 編碼中 Unicode 高代理代碼單元的最小值,常量 '\uD800'。 高代理也稱為領(lǐng)先代理。
MIN_LOW_SURROGATE
public static final char MIN_LOW_SURROGATE
UTF-16 編碼中 Unicode 低代理代碼單元的最小值,常量 '\uDC00'。 低代理也稱為尾隨代理。
MIN_RADIX
public static final int MIN_RADIX
可用于與字符串相互轉(zhuǎn)換的最小基數(shù)。 該字段的常量值是基數(shù)轉(zhuǎn)換方法(如 digit 方法、forDigit 方法和 Integer 類的 toString 方法)中允許的 radix 參數(shù)的最小值。
MIN_SUPPLEMENTARY_CODE_POINT
public static final int MIN_SUPPLEMENTARY_CODE_POINT
Unicode 補(bǔ)充碼點(diǎn)的最小值,常數(shù) U+10000。
MIN_SURROGATE
public static final char MIN_SURROGATE
UTF-16 編碼中 Unicode 代理代碼單元的最小值,常量 '\uD800'。
MIN_VALUE
public static final char MIN_VALUE
該字段的常數(shù)值是 char 類型的最小值,'\u0000'。
MODIFIER_LETTER
public static final byte MODIFIER_LETTER
Unicode 規(guī)范中的通用類別“Lm”。
MODIFIER_SYMBOL
public static final byte MODIFIER_SYMBOL
Unicode 規(guī)范中的通用類別“Sk”。
NON_SPACING_MARK
public static final byte NON_SPACING_MARK
Unicode 規(guī)范中的通用類別“Mn”。
OTHER_LETTER
public static final byte OTHER_LETTER
Unicode 規(guī)范中的通用類別“Lo”。
OTHER_NUMBER
public static final byte OTHER_NUMBER
Unicode 規(guī)范中的通用類別“No”。
OTHER_PUNCTUATION
public static final byte OTHER_PUNCTUATION
Unicode 規(guī)范中的通用類別“Po”。
OTHER_SYMBOL
public static final byte OTHER_SYMBOL
Unicode 規(guī)范中的一般類別“So”。
PARAGRAPH_SEPARATOR
public static final byte PARAGRAPH_SEPARATOR
Unicode 規(guī)范中的通用類別“Zp”。
PRIVATE_USE
public static final byte PRIVATE_USE
Unicode 規(guī)范中的通用類別“Co”。
SIZE
public static final int SIZE
用于以無符號二進(jìn)制形式表示 char 值的位數(shù),常量 16。
SPACE_SEPARATOR
public static final byte SPACE_SEPARATOR
Unicode 規(guī)范中的通用類別“Zs”。
START_PUNCTUATION
public static final byte START_PUNCTUATION
Unicode 規(guī)范中的通用類別“Ps”。
SURROGATE
public static final byte SURROGATE
Unicode 規(guī)范中的通用類別“Cs”。
TITLECASE_LETTER
public static final byte TITLECASE_LETTER
Unicode 規(guī)范中的通用類別“Lt”。
TYPE
public static final ClassCharacter TYPE
表示基本類型 char 的 Class 實(shí)例。
UNASSIGNED
public static final byte UNASSIGNED
Unicode 規(guī)范中的通用類別“Cn”。
UPPERCASE_LETTER
public static final byte UPPERCASE_LETTER
Unicode 規(guī)范中的通用類別“Lu”。
構(gòu)造函數(shù)詳細(xì)信息
Character
public Character(char value)
構(gòu)造一個(gè)新分配的 Character 對象,該對象表示指定的 char 值。
參數(shù):
| 參數(shù)名稱 | 參數(shù)描述 |
|---|---|
| value | 要由 Character 對象表示的值。 |
方法詳情
valueOf
public static Character valueOf(char c)
返回表示指定 char 值的 Character 實(shí)例。 如果不需要新的 Character 實(shí)例,則通常應(yīng)優(yōu)先使用此方法而不是構(gòu)造函數(shù) Character(char),因?yàn)榇朔椒赡軙?huì)通過緩存頻繁請求的值來顯著提高空間和時(shí)間性能。 此方法將始終緩存 '\u0000' 到 '\u007F' 范圍內(nèi)的值,包括在內(nèi),并且可能緩存此范圍之外的其他值。
參數(shù):
| 參數(shù)名稱 | 參數(shù)描述 |
|---|---|
| c | 一個(gè)字符值。 |
返回:
一個(gè)代表 c 的 Character 實(shí)例。
charValue
public char charValue()
返回此 Character 對象的值。
返回:
此對象表示的原始 char 值。
hashCode
public int hashCode()
返回此字符的哈希碼; 等于調(diào)用 charValue() 的結(jié)果。
覆蓋:
類 Object 中的 hashCode
返回:
此字符的哈希碼值
hashCode
public static int hashCode(char value)
返回 char 值的哈希碼; 與 Character.hashCode() 兼容。
參數(shù):
| 參數(shù)名稱 | 參數(shù)描述 |
|---|---|
| value | 要為其返回哈希碼的字符。 |
返回:
char 值的哈希碼值。
equals
public boolean equals(Object obj)
將此對象與指定對象進(jìn)行比較。 當(dāng)且僅當(dāng)參數(shù)不為 null 并且是表示與此對象相同的 char 值的 Character 對象時(shí),結(jié)果才為真。
覆蓋:
類 Object 中的等于
參數(shù):
| 參數(shù)名稱 | 參數(shù)描述 |
|---|---|
| obj | 比較的對象。 |
返回:
如果對象相同,則為 true; 否則為假。
toString
public String toString()
返回一個(gè)表示此 Character 值的 String 對象。 結(jié)果是長度為 1 的字符串,其唯一組成部分是此 Character 對象表示的原始 char 值。
覆蓋:
類 Object 中的 toString
返回:
此對象的字符串表示形式。
toString
public static String toString(char c)
返回表示指定字符的 String 對象。 結(jié)果是長度為 1 的字符串,僅由指定的字符組成。
參數(shù):
| 參數(shù)名稱 | 參數(shù)描述 |
|---|---|
| c | 要轉(zhuǎn)換的字符 |
返回:
指定字符的字符串表示
isValidCodePoint
public static boolean isValidCodePoint(int codePoint)
確定指定的代碼點(diǎn)是否是有效的 Unicode 代碼點(diǎn)值。
參數(shù):
| 參數(shù)名稱 | 參數(shù)描述 |
|---|---|
| codePoint | 要測試的 Unicode 代碼點(diǎn) |
返回:
如果指定的代碼點(diǎn)值介于 MIN_CODE_POINT 和 MAX_CODE_POINT 之間,則為 true; 否則為假。
isBmpCodePoint
public static boolean isBmpCodePoint(int codePoint)
確定指定字符(Unicode 代碼點(diǎn))是否在基本多語言平面 (BMP) 中。 這樣的代碼點(diǎn)可以使用單個(gè)字符來表示。
參數(shù):
| 參數(shù)名稱 | 參數(shù)描述 |
|---|---|
| codePoint | 要測試的字符(Unicode 代碼點(diǎn)) |
返回:
如果指定的代碼點(diǎn)介于 MIN_VALUE 和 MAX_VALUE 之間,則為 true; 否則為假。
isSupplementaryCodePoint
public static boolean isSupplementaryCodePoint(int codePoint)
確定指定字符(Unicode 代碼點(diǎn))是否在補(bǔ)充字符范圍內(nèi)。
參數(shù):
| 參數(shù)名稱 | 參數(shù)描述 |
|---|---|
| codePoint | 要測試的字符(Unicode 代碼點(diǎn)) |
返回:
如果指定的代碼點(diǎn)介于 MIN_SUPPLEMENTARY_CODE_POINT 和 MAX_CODE_POINT 之間,則為 true; 否則為假。
isHighSurrogate
public static boolean isHighSurrogate(char ch)
確定給定的 char 值是否是 Unicode 高代理代碼單元(也稱為前導(dǎo)代理代碼單元)。
這些值本身并不表示字符,而是用于表示 UTF-16 編碼中的補(bǔ)充字符。
參數(shù):
| 參數(shù)名稱 | 參數(shù)描述 |
|---|---|
| ch | 要測試的 char 值。 |
返回:
如果 char 值介于 MIN_HIGH_SURROGATE 和 MAX_HIGH_SURROGATE 之間,則為 true; 否則為假。
isLowSurrogate
public static boolean isLowSurrogate(char ch)
確定給定的 char 值是否是 Unicode 低代理代碼單元(也稱為尾隨代理代碼單元)。
這些值本身并不表示字符,而是用于表示 UTF-16 編碼中的補(bǔ)充字符。
參數(shù):
| 參數(shù)名稱 | 參數(shù)描述 |
|---|---|
| ch | 要測試的 char 值。 |
返回:
如果 char 值介于 MIN_LOW_SURROGATE 和 MAX_LOW_SURROGATE 之間,則為 true; 否則為假。
isSurrogate
public static boolean isSurrogate(char ch)
確定給定的 char 值是否是 Unicode 代理代碼單元。
這些值本身并不表示字符,而是用于表示 UTF-16 編碼中的補(bǔ)充字符。
char 值是代理代碼單元當(dāng)且僅當(dāng)它是低代理代碼單元或高代理代碼單元。
參數(shù):
| 參數(shù)名稱 | 參數(shù)描述 |
|---|---|
| ch | 要測試的 char 值。 |
返回:
如果 char 值介于 MIN_SURROGATE 和 MAX_SURROGATE 之間,則為 true; 否則為假。
isSurrogatePair
public static boolean isSurrogatePair(char high, char low)
確定指定的 char 值對是否為有效的 Unicode 代理項(xiàng)對。
該方法等價(jià)于表達(dá)式:
isHighSurrogate(high) && isLowSurrogate(low) 參數(shù):
| 參數(shù)名稱 | 參數(shù)描述 |
|---|---|
| high | 要測試的高代理代碼值 |
| low | 要測試的低代理代碼值 |
返回:
如果指定的高和低代理代碼值表示有效的代理對,則為 true; 否則為假。
charCount
public static int charCount(int codePoint)
確定表示指定字符(Unicode 代碼點(diǎn))所需的 char 值的數(shù)量。 如果指定字符等于或大于 0x10000,則該方法返回 2。否則,該方法返回 1。
此方法不會(huì)驗(yàn)證指定字符是否為有效的 Unicode 代碼點(diǎn)。 如有必要,調(diào)用者必須使用 isValidCodePoint 驗(yàn)證字符值。
參數(shù):
| 參數(shù)名稱 | 參數(shù)描述 |
|---|---|
| codePoint | 要測試的字符(Unicode 代碼點(diǎn))。 |
返回:
2 如果字符是有效的補(bǔ)充字符; 1 否則。
toCodePoint
public static int toCodePoint(char high, char low)
將指定的代理對轉(zhuǎn)換為其補(bǔ)充代碼點(diǎn)值。 此方法不驗(yàn)證指定的代理對。 如有必要,調(diào)用者必須使用 isSurrogatePair 對其進(jìn)行驗(yàn)證。
參數(shù):
| 參數(shù)名稱 | 參數(shù)描述 |
|---|---|
| high | 高代理代碼單元 |
| low | 低代理代碼單元 |
返回:
由指定代理對組成的補(bǔ)充代碼點(diǎn)。
codePointAt
public static int codePointAt(CharSequence seq, int index)
返回 CharSequence 的給定索引處的代碼點(diǎn)。 如果 CharSequence 中給定索引處的 char 值在高代理范圍內(nèi),后續(xù)索引小于 CharSequence 的長度,并且后續(xù)索引處的 char 值在低代理范圍內(nèi),則補(bǔ)充 返回與此代理對對應(yīng)的代碼點(diǎn)。 否則,返回給定索引處的 char 值。
參數(shù):
| 參數(shù)名稱 | 參數(shù)描述 |
|---|---|
| seq | 一系列 char 值(Unicode 代碼單元) |
| index | 要轉(zhuǎn)換的 seq 中 char 值(Unicode 代碼單元)的索引 |
返回:
給定索引處的 Unicode 代碼點(diǎn)
Throws:
| Throw名稱 | Throw描述 |
|---|---|
| NullPointerException | 如果 seq 為空。 |
| IndexOutOfBoundsException | 如果值索引為負(fù)數(shù)或不小于 CharSequence#length()。 |
codePointAt
public static int codePointAt(char[] a, int index)
返回 char 數(shù)組給定索引處的代碼點(diǎn)。 如果 char 數(shù)組中給定索引處的 char 值在高代理范圍內(nèi),后面的索引小于 char 數(shù)組的長度,并且后面的索引處的 char 值在低代理范圍內(nèi),則 返回與該代理對對應(yīng)的補(bǔ)充代碼點(diǎn)。 否則,返回給定索引處的 char 值。
參數(shù):
| 參數(shù)名稱 | 參數(shù)描述 |
|---|---|
| a | 字符數(shù)組 |
| index | 要轉(zhuǎn)換的 char 數(shù)組中的 char 值(Unicode 代碼單元)的索引 |
返回:
給定索引處的 Unicode 代碼點(diǎn)
Throws:
| Throw名稱 | Throw描述 |
|---|---|
| NullPointerException | 如果 a 為空。 |
| IndexOutOfBoundsException | 如果值索引為負(fù)數(shù)或不小于 char 數(shù)組的長度。 |
codePointAt
public static int codePointAt(char[] a, int index, int limit)
返回 char 數(shù)組給定索引處的代碼點(diǎn),其中只能使用索引小于限制的數(shù)組元素。 如果 char 數(shù)組中給定索引處的 char 值在高代理范圍內(nèi),后面的索引小于限制,并且后面的索引處的 char 值在低代理范圍內(nèi),則補(bǔ)充代碼點(diǎn) 返回對應(yīng)于這個(gè)代理對。 否則,返回給定索引處的 char 值。
參數(shù):
| 參數(shù)名稱 | 參數(shù)描述 |
|---|---|
| a | 字符數(shù)組 |
| index | 要轉(zhuǎn)換的 char 數(shù)組中的 char 值(Unicode 代碼單元)的索引 |
| limit | 可以在 char 數(shù)組中使用的最后一個(gè)數(shù)組元素之后的索引 |
返回:
給定索引處的 Unicode 代碼點(diǎn)
Throws:
| Throw名稱 | Throw描述 |
|---|---|
| NullPointerException | 如果 a 為空。 |
| IndexOutOfBoundsException | 如果 index 參數(shù)為負(fù)數(shù)或不小于 limit 參數(shù),或者 limit 參數(shù)為負(fù)數(shù)或大于 char 數(shù)組的長度。 |
codePointBefore
public static int codePointBefore(CharSequence seq, int index)
返回 CharSequence 的給定索引之前的代碼點(diǎn)。 如果 CharSequence 中 (index - 1) 處的 char 值在低代理范圍內(nèi),則 (index - 2) 不為負(fù),并且 CharSequence 中 (index - 2) 處的 char 值在高代理范圍內(nèi) ,則返回該代理對對應(yīng)的補(bǔ)充碼點(diǎn)。 否則,返回 (index - 1) 處的 char 值。
參數(shù):
| 參數(shù)名稱 | 參數(shù)描述 |
|---|---|
| seq | CharSequence 實(shí)例 |
| index | 應(yīng)返回的代碼點(diǎn)之后的索引 |
返回:
給定索引之前的 Unicode 代碼點(diǎn)值。
Throws:
| Throw名稱 | Throw描述 |
|---|---|
| NullPointerException | 如果 seq 為空。 |
| IndexOutOfBoundsException | 如果索引參數(shù)小于 1 或大于 CharSequence#length()。 |
codePointBefore
public static int codePointBefore(char[] a, int index)
返回 char 數(shù)組的給定索引之前的代碼點(diǎn)。 如果 char 數(shù)組中 (index - 1) 處的 char 值在低代理范圍內(nèi),則 (index - 2) 不為負(fù),并且 char 數(shù)組中 (index - 2) 處的 char 值在高 - 代理范圍,則返回該代理對對應(yīng)的補(bǔ)充碼位。 否則,返回 (index - 1) 處的 char 值。
參數(shù):
| 參數(shù)名稱 | 參數(shù)描述 |
|---|---|
| a | 字符數(shù)組 |
| index | 應(yīng)返回的代碼點(diǎn)之后的索引 |
返回:
給定索引之前的 Unicode 代碼點(diǎn)值。
Throws:
| Throw名稱 | Throw描述 |
|---|---|
| NullPointerException | 如果 a 為空。 |
| IndexOutOfBoundsException | 如果 index 參數(shù)小于 1 或大于 char 數(shù)組的長度 |
codePointBefore
public static int codePointBefore(char[] a, int index, int start)
返回 char 數(shù)組的給定索引之前的代碼點(diǎn),其中只能使用索引大于或等于 start 的數(shù)組元素。 如果 char 數(shù)組中 (index - 1) 處的 char 值在低代理范圍內(nèi),則 (index - 2) 不小于 start,并且 char 數(shù)組中 (index - 2) 處的 char 值在 high-surrogate range,則返回該代理對對應(yīng)的補(bǔ)充碼點(diǎn)。 否則,返回 (index - 1) 處的 char 值。
參數(shù):
| 參數(shù)名稱 | 參數(shù)描述 |
|---|---|
| a | 字符數(shù)組 |
| index | 應(yīng)返回的代碼點(diǎn)之后的索引 |
| start | char 數(shù)組中第一個(gè)數(shù)組元素的索引 |
返回:
給定索引之前的 Unicode 代碼點(diǎn)值。
Throws:
| Throw名稱 | Throw描述 |
|---|---|
| NullPointerException | 如果 a 為空。 |
| IndexOutOfBoundsException | 如果 index 參數(shù)不大于 start 參數(shù)或大于 char 數(shù)組的長度,或者 start 參數(shù)為負(fù)數(shù)或不小于 char 數(shù)組的長度。 |
highSurrogate
public static char highSurrogate(int codePoint)
返回以 UTF-16 編碼表示指定補(bǔ)充字符(Unicode 代碼點(diǎn))的代理項(xiàng)對的前導(dǎo)代理項(xiàng)(高代理項(xiàng)代碼單元)。 如果指定的字符不是補(bǔ)充字符,則返回未指定的字符。
如果 isSupplementaryCodePoint(x) 為真,則 isHighSurrogate(highSurrogate(x)) 和 toCodePoint(highSurrogate(x), lowSurrogate(x)) == x 也始終為真。
參數(shù):
| 參數(shù)名稱 | 參數(shù)描述 |
|---|---|
| codePoint | 補(bǔ)充字符(Unicode 代碼點(diǎn)) |
返回:
用于以 UTF-16 編碼表示字符的前導(dǎo)代理代碼單元
lowSurrogate
public static char lowSurrogate(int codePoint)
返回以 UTF-16 編碼表示指定補(bǔ)充字符(Unicode 代碼點(diǎn))的代理項(xiàng)對的尾隨代理項(xiàng)(低代理項(xiàng)代碼單元)。 如果指定的字符不是補(bǔ)充字符,則返回未指定的字符。
如果 isSupplementaryCodePoint(x) 為真,則 isLowSurrogate(lowSurrogate(x)) 和 toCodePoint(highSurrogate(x), lowSurrogate(x)) == x 也始終為真。
參數(shù):
| 參數(shù)名稱 | 參數(shù)描述 |
|---|---|
| codePoint | 補(bǔ)充字符(Unicode 代碼點(diǎn)) |
返回:
用于以 UTF-16 編碼表示字符的尾隨代理代碼單元
toChars
public static int toChars(int codePoint, char[] dst, int dstIndex)
將指定的字符(Unicode 代碼點(diǎn))轉(zhuǎn)換為其 UTF-16 表示。 如果指定的code point是BMP(Basic Multilingual Plane or Plane 0)值,則將相同的值存儲在dst[dstIndex]中,并返回1。 如果指定的碼位是增補(bǔ)字符,則將其代理值存儲在 dst[dstIndex](高代理)和 dst[dstIndex+1](低代理)中,并返回 2。
參數(shù):
| 參數(shù)名稱 | 參數(shù)描述 |
|---|---|
| codePoint | 要轉(zhuǎn)換的字符(Unicode 代碼點(diǎn))。 |
| dst | 一個(gè) char 數(shù)組,其中存儲了 codePoint 的 UTF-16 值。 |
| dstIndex | 存儲轉(zhuǎn)換值的 dst 數(shù)組的起始索引。 |
返回:
如果代碼點(diǎn)是 BMP 代碼點(diǎn),則為 1,如果代碼點(diǎn)是補(bǔ)充代碼點(diǎn),則為 2。
Throws:
| Throw名稱 | Throw描述 |
|---|---|
| IllegalArgumentException | 如果指定的 codePoint 不是有效的 Unicode 代碼點(diǎn)。 |
| NullPointerException | 如果指定的 dst 為空。 |
| IndexOutOfBoundsException | 如果 dstIndex 為負(fù)數(shù)或不小于 dst.length,或者如果 dstIndex 處的 dst 沒有足夠的數(shù)組元素來存儲結(jié)果 char 值。 (如果 dstIndex 等于 dst.length-1 并且指定的 codePoint 是補(bǔ)充字符,則高代理值不存儲在 dst[dstIndex] 中。) |
toChars
public static char[] toChars(int codePoint)
將指定字符(Unicode 代碼點(diǎn))轉(zhuǎn)換為存儲在 char 數(shù)組中的 UTF-16 表示形式。 如果指定的代碼點(diǎn)是 BMP(基本多語言平面或平面 0)值,則生成的 char 數(shù)組具有與 codePoint 相同的值。 如果指定的代碼點(diǎn)是補(bǔ)充代碼點(diǎn),則生成的 char 數(shù)組具有相應(yīng)的代理對。
參數(shù):
| 參數(shù)名稱 | 參數(shù)描述 |
|---|---|
| codePoint | 一個(gè) Unicode 代碼點(diǎn) |
返回:
具有 codePoint 的 UTF-16 表示形式的 char 數(shù)組。
Throws:
| Throw名稱 | Throw描述 |
|---|---|
| IllegalArgumentException | 如果指定的 codePoint 不是有效的 Unicode 代碼點(diǎn)。 |
codePointCount
public static int codePointCount(CharSequence seq, int beginIndex, int endIndex)
返回指定字符序列的文本范圍內(nèi)的 Unicode 代碼點(diǎn)數(shù)。 文本范圍從指定的 beginIndex 開始并延伸到索引 endIndex - 1 處的字符。因此,文本范圍的長度(以字符為單位)為 endIndex-beginIndex。 文本范圍內(nèi)的未配對代理項(xiàng)分別計(jì)為一個(gè)代碼點(diǎn)。
參數(shù):


咨詢
建站咨詢
