2022년 4월 3일 일요일

유니코드 정규식 - 유니코드 범위 목록

 유니코드 정규식

처음영어한국어
0000007FControls and Basic Latin제어 문자와 라틴 기본
008000FFControls and Latin-1 Supplement제어 문자와 라틴 보충
0100017FLatin Extended-A라틴 확장-A
0180024FLatin Extended-B라틴 확장-B
025002AFIPA Extensions국제 음성 기호 확장
02B002FFSpacing Modifier Letters조정 문자
0300036FCombining Diacritical Marks조합 분음 기호(악센트)
037003FFGreek and Coptic그리스어와 콥트어
040004FFCyrillic키릴 자모
0500052FCyrillic Supplementary키릴 자모 보충
0530058FArmenian아르메니아어
059005FFHebrew히브리어
060006FFArabic아랍어
0700074FSyriac시리아어
0750077FArabic Supplement아랍어 보충
078007BFThaana타아나어
07C007FFN'Ko은코
0900097FDevanagari데바나가리어
098009FFBengali벵골어
0A000A7FGurmukhi굴묵키어
0A800AFFGujarati구자라트어
0B000B7FOriya오리야어
0B800BFFTamil타밀어
0C000C7FTelugu텔루구어
0C800CFFKannada칸나다어
0D000D7FMalayalam말라얄람어
0D800DFFSinhala신할라어
0E000E7FThai타이어
0E800EFFLao라오어
0F000FFFTibetan티베트어
1000109FMyanmar미얀마어
10A010FFGeorgian그루지야어
110011FFHangul Jamo한글 자모
1200137FEthiopic에티오피아어
1380139FEthiopic Supplement에티오피아어 보충
13A013FFCherokee체로키어
1400167FUnified Canadian Aboriginal Syllabics통합 캐나다 원주민 글자 마디
1680169FOgham오검 문자
16A016FFRunic룬 문자
1700171FTagalog타갈로그어
1720173FHanunoo하누누어
1740175FBuhid부히드어
1760177FTagbanwa타그반와어
178017FFKhmer크메르어(캄보디아어)
180018AFMongolian몽골어
1900194FLimbu림부
1950197FTai Le타이 레 문자
198019DFNew Tai Lue새 타이 루에
19E019FFKhmer Symbols크메르 기호
1A001A1FBuginese부기 문자
1B001B7FBalinese발리 문자
1D001D7FPhonetic Extensions음성 부호 확장
1D801DBFPhonetic Extensions Supplement음성 부호 확장 보충
1DC01DFFCombining Diacritical Marks Supplement조합 분음 부호(악센트) 보충
1E001EFFLatin Extended Additional라틴어 추가 확장
1F001FFFGreek Extended그리스어 확장
2000206FGeneral Punctuation일반 구두점
2070209FSuperscripts and Subscripts위 첨자와 아래 첨자
20A020CFCurrency Symbols화폐 기호
20D020FFCombining Diacritical Marks for Symbols조합 분음 부호(기호)
2100214FLetterlike Symbols글자를 변형한 기호
2150218FNumber Forms여러 가지 수
219021FFArrows화살표
220022FFMathematical Operators수학 연산자
230023FFMiscellaneous Technical여러 가지 기술 기호
2400243FControl Pictures제어 문자 기호
2440245FOptical Character Recognition문자 인식(OCR) 기호
246024FFEnclosed Alphanumerics괄호 문자
2500257FBox Drawing상자 그리기 기호
2580259FBlock Elements네모 기호
25A025FFGeometric Shapes도형 기호
260026FFMiscellaneous Symbols여러 가지 기호
270027BFDingbats딩뱃 기호
27C027EFMiscellaneous Mathematical Symbols-A여러 가지 수학 기호-A
27F027FFSupplemental Arrows-A화살표 보충-A
280028FFBraille Patterns점자
2900297FSupplemental Arrows-B화살표 보충-B
298029FFMiscellaneous Mathematical Symbols-B여러 가지 수학 기호-B
2A002AFFSupplemental Mathematical Operators수학 연산자 보충
2B002BFFMiscellaneous Symbols and Arrows여러 가지 기호와 화살표
2C002C5FGlagolitic글라골리틱 문자
2C602C7FLatin Extended-C라틴 확장-C
2C802CFFCoptic콥트어
2D002D2FGeorgian Supplement그루지야어 보충
2D302D7FTifinagh티피나그
2D802DDFEthiopic Extended에티오피아어 보충
2E002E7FSupplemental Punctuation구두점 보충
2E802EFFCJK Radicals Supplement한중일 부수 보충
2F002FDFKangXi Radicals강희자전 부수
2FF02FFFIdeographic Description characters한자 생김꼴 지시 부호
3000303FCJK Symbols and Punctuation한중일 기호 및 구두점
3040309FHiragana히라가나
30A030FFKatakana가타카나
3100312FBopomofo주음 부호
3130318FHangul Compatibility Jamo호환용 한글 자모
3190319FKanbun훈독 순서 지시 부호
31A031BFBopomofo Extended주음 부호 확장
31C031EFCJK Strokes한중일 한자 획
31F031FFKatakana Phonetic Extensions가타카나 음성 확장
320032FFEnclosed CJK Letters and Months한중일 괄호 문자
330033FFCJK Compatibility한중일 호환용
34004DBFCJK Unified Ideographs Extension A한중일 통합 한자 확장-A
4DC04DFFYijing Hexagram Symbols역경 6줄 기호
4E009FBFCJK Unified Ideographs한중일 통합 한자
A000A48FYi Syllables이(Yi) 글자 마디
A490A4CFYi Radicals이(Yi) 부수
A700A71FModifier Tone Letters어조 조정 문자
A720A7FFLatin Extended-D라틴 확장-D
A800A82FSyloti Nagri실헤티 나가리
A840A87FPhags-Pa파스파 문자
AC00D7AFHangul Syllables한글 글자 마디
D800DBFFHigh Surrogate Area상위 대체 영역
DC00DFFFLow Surrogate Area하위 대체 영역
E000F8FFPrivate Use Area사용자 영역
F900FAFFCJK Compatibility Ideographs한중일 호환용 한자
FB00FB4FAlphabetic Presentation Forms영문 표현꼴
FB50FDFFArabic Presentation Forms-A아랍어 표현꼴-A
FE00FE0FVariation Selectors모양 구별 문자
FE10FE1FVertical Forms세로쓰기 모양
FE20FE2FCombining Half Marks조합용 반쪽 기호
FE30FE4FCJK Compatibility Forms한중일 호환용 꼴
FE50FE6FSmall Form Variants작은꼴 변형
FE70FEFFArabic Presentation Forms-B아랍어 표현꼴-B
FF00FFEFHalfwidth and Fullwidth Forms전각/반각 모양
FFF0FFFFSpecials특수 제어 문자
100001007FLinear B Syllabary선상 B 음절 문자
10080100FFLinear B Ideograms선상 B 상형 문자
101001013FAegean Numbers에게(Aegean) 숫자
101401018FAncient Greek Numbers옛 그리스 숫자
103001032FOld Italic옛 이탈리아 문자
103301034FGothic옛 고딕체 알파벳
103801039FUgaritic우가리트 문자
103A0103DFOld Persian옛 페르시아 문자
104001044FDeseret데저렛 문자
104501047FShavian샤우 문자
10480104AFOsmanya오스마니아 문자
108001083FCypriot Syllabary키프로스 음절 문자
109001091FPhoenician페니키아 문자
10A0010A5FKharoshthi카로슈티
12000123FFCuneiform쐐기 문자
124001247FCuneiform Numbers and Punctuation쐐기 문자 숫자·문장 부호
1D0001D0FFByzantine Musical Symbols비잔틴 시대의 악보용 기호
1D1001D1FFMusical Symbols악보용 기호
1D2001D24FAncient Greek Musical Notation고대 그리스 시대의 악보용 기호
1D3001D35FTai Xuan Jing Symbols태현경 기호
1D4001D7FFMathematical Alphanumeric Symbols수학식에서 쓰이는 알파벳
200002A6DFCJK Unified Ideographs Extension B한중일 통합 한자 확장-B
2F8002FA1FCJK Compatibility Ideographs Supplement한중일 호환용 한자 보충
E0000E007FTags태그
E0100E01EFVariation Selectors Supplement모양 구별 문자 보충
F0000FFFFFSupplementary Private Use Area-A사용자 영역 보충-A
10000010FFFFSupplementary Private Use Area-B사용자 영역 보충-B



\p{InBasic_Latin}: U+0000–U+007F

\p{InLatin-1_Supplement}: U+0080–U+00FF

\p{InLatin_Extended-A}: U+0100–U+017F

\p{InLatin_Extended-B}: U+0180–U+024F

\p{InIPA_Extensions}: U+0250–U+02AF

\p{InSpacing_Modifier_Letters}: U+02B0–U+02FF

\p{InCombining_Diacritical_Marks}: U+0300–U+036F

\p{InGreek_and_Coptic}: U+0370–U+03FF

\p{InCyrillic}: U+0400–U+04FF

\p{InCyrillic_Supplementary}: U+0500–U+052F

\p{InArmenian}: U+0530–U+058F

\p{InHebrew}: U+0590–U+05FF

\p{InArabic}: U+0600–U+06FF

\p{InSyriac}: U+0700–U+074F

\p{InThaana}: U+0780–U+07BF

\p{InDevanagari}: U+0900–U+097F

\p{InBengali}: U+0980–U+09FF

\p{InGurmukhi}: U+0A00–U+0A7F

\p{InGujarati}: U+0A80–U+0AFF

\p{InOriya}: U+0B00–U+0B7F

\p{InTamil}: U+0B80–U+0BFF

\p{InTelugu}: U+0C00–U+0C7F

\p{InKannada}: U+0C80–U+0CFF

\p{InMalayalam}: U+0D00–U+0D7F

\p{InSinhala}: U+0D80–U+0DFF

\p{InThai}: U+0E00–U+0E7F

\p{InLao}: U+0E80–U+0EFF

\p{InTibetan}: U+0F00–U+0FFF

\p{InMyanmar}: U+1000–U+109F

\p{InGeorgian}: U+10A0–U+10FF

\p{InHangul_Jamo}: U+1100–U+11FF

\p{InEthiopic}: U+1200–U+137F

\p{InCherokee}: U+13A0–U+13FF

\p{InUnified_Canadian_Aboriginal_Syllabics}: U+1400–U+167F

\p{InOgham}: U+1680–U+169F

\p{InRunic}: U+16A0–U+16FF

\p{InTagalog}: U+1700–U+171F

\p{InHanunoo}: U+1720–U+173F

\p{InBuhid}: U+1740–U+175F

\p{InTagbanwa}: U+1760–U+177F

\p{InKhmer}: U+1780–U+17FF

\p{InMongolian}: U+1800–U+18AF

\p{InLimbu}: U+1900–U+194F

\p{InTai_Le}: U+1950–U+197F

\p{InKhmer_Symbols}: U+19E0–U+19FF

\p{InPhonetic_Extensions}: U+1D00–U+1D7F

\p{InLatin_Extended_Additional}: U+1E00–U+1EFF

\p{InGreek_Extended}: U+1F00–U+1FFF

\p{InGeneral_Punctuation}: U+2000–U+206F

\p{InSuperscripts_and_Subscripts}: U+2070–U+209F

\p{InCurrency_Symbols}: U+20A0–U+20CF

\p{InCombining_Diacritical_Marks_for_Symbols}: U+20D0–U+20FF

\p{InLetterlike_Symbols}: U+2100–U+214F

\p{InNumber_Forms}: U+2150–U+218F

\p{InArrows}: U+2190–U+21FF

\p{InMathematical_Operators}: U+2200–U+22FF

\p{InMiscellaneous_Technical}: U+2300–U+23FF

\p{InControl_Pictures}: U+2400–U+243F

\p{InOptical_Character_Recognition}: U+2440–U+245F

\p{InEnclosed_Alphanumerics}: U+2460–U+24FF

\p{InBox_Drawing}: U+2500–U+257F

\p{InBlock_Elements}: U+2580–U+259F

\p{InGeometric_Shapes}: U+25A0–U+25FF

\p{InMiscellaneous_Symbols}: U+2600–U+26FF

\p{InDingbats}: U+2700–U+27BF

\p{InMiscellaneous_Mathematical_Symbols-A}: U+27C0–U+27EF

\p{InSupplemental_Arrows-A}: U+27F0–U+27FF

\p{InBraille_Patterns}: U+2800–U+28FF

\p{InSupplemental_Arrows-B}: U+2900–U+297F

\p{InMiscellaneous_Mathematical_Symbols-B}: U+2980–U+29FF

\p{InSupplemental_Mathematical_Operators}: U+2A00–U+2AFF

\p{InMiscellaneous_Symbols_and_Arrows}: U+2B00–U+2BFF

\p{InCJK_Radicals_Supplement}: U+2E80–U+2EFF

\p{InKangxi_Radicals}: U+2F00–U+2FDF

\p{InIdeographic_Description_Characters}: U+2FF0–U+2FFF

\p{InCJK_Symbols_and_Punctuation}: U+3000–U+303F

\p{InHiragana}: U+3040–U+309F

\p{InKatakana}: U+30A0–U+30FF

\p{InBopomofo}: U+3100–U+312F

\p{InHangul_Compatibility_Jamo}: U+3130–U+318F

\p{InKanbun}: U+3190–U+319F

\p{InBopomofo_Extended}: U+31A0–U+31BF

\p{InKatakana_Phonetic_Extensions}: U+31F0–U+31FF

\p{InEnclosed_CJK_Letters_and_Months}: U+3200–U+32FF

\p{InCJK_Compatibility}: U+3300–U+33FF

\p{InCJK_Unified_Ideographs_Extension_A}: U+3400–U+4DBF

\p{InYijing_Hexagram_Symbols}: U+4DC0–U+4DFF

\p{InCJK_Unified_Ideographs}: U+4E00–U+9FFF

\p{InYi_Syllables}: U+A000–U+A48F

\p{InYi_Radicals}: U+A490–U+A4CF

\p{InHangul_Syllables}: U+AC00–U+D7AF

\p{InHigh_Surrogates}: U+D800–U+DB7F

\p{InHigh_Private_Use_Surrogates}: U+DB80–U+DBFF

\p{InLow_Surrogates}: U+DC00–U+DFFF

\p{InPrivate_Use_Area}: U+E000–U+F8FF

\p{InCJK_Compatibility_Ideographs}: U+F900–U+FAFF

\p{InAlphabetic_Presentation_Forms}: U+FB00–U+FB4F

\p{InArabic_Presentation_Forms-A}: U+FB50–U+FDFF

\p{InVariation_Selectors}: U+FE00–U+FE0F

\p{InCombining_Half_Marks}: U+FE20–U+FE2F

\p{InCJK_Compatibility_Forms}: U+FE30–U+FE4F

\p{InSmall_Form_Variants}: U+FE50–U+FE6F

\p{InArabic_Presentation_Forms-B}: U+FE70–U+FEFF

\p{InHalfwidth_and_Fullwidth_Forms}: U+FF00–U+FFEF

\p{InSpecials}: U+FFF0–U+FFFF


자료: 


http://www.mins01.com/mh/tech/read/582?tq=title&q=%EC%9C%A0%EB%8B%88%EC%BD%94%EB%93%9C

https://www.regular-expressions.info/unicode.html

댓글 없음:

댓글 쓰기