유니코드(Unicode)는 전 세계의 문자와 기호를 통일된 방식으로 표현하기 위한 컴퓨터 데이터의 문자 인코딩 표준이다. 1991년에 처음 제정되어 현재 고도화된 형태로 발전하였다. 유니코드는 다양한 언어를 지원하며, 그 범위는 라틴 문자, 한자, 아랍 문자, 그리스 문자 등 모든 자연 언어의 문자뿐만 아니라 기호, 이모지, 수학 기호 등 다양한 문자를 포함한다.
유니코드는 각 문자에 고유한 숫자인코드 포인트를 부여한다. 예를 들어, 아스키 문자 집합에서 'A'는 65라는 코드 포인트를 가지며, 유니코드에서는 U+0041로 표현된다. 유니코드는 문자 인코딩의 여러 방법을 지원하는데, UTF-8, UTF-16, UTF-32가 대표적이다. 이들 인코딩 방식은 데이터의 저장 및 전송 효율성에 따라 차별화된다.
유니코드는 국제기구인 유니코드 컨소시엄(Unicode Consortium)에 의해 관리되며, 주기적으로 새로운 문자와 기호를 추가하고 있어 지속적으로 확장되고 있다. 유니코드는 현대의 다양한 소프트웨어와 시스템에서 널리 사용되며, 웹 페이지나 애플리케이션에서 다국어 지원을 가능하게 한다. 유니코드를 사용함으로써 소프트웨어의 호환성, 상호 운용성 및 글로벌화가 용이해진다.