Engineering Note

[Java] 자바의 문자열 공백 제거 및 공백 기준 문자열 나누기 본문

Programming Language/Java

[Java] 자바의 문자열 공백 제거 및 공백 기준 문자열 나누기

Software Engineer Kim 2025. 6. 18. 17:34

String 클래스의 공백 제거 메서드는 두 가지가 있다. trim()과 strip()

strip()은 Java 11부터 추가된 메서드다. trim은 아스키 코드 기반의 whitespace만 제거가 가능한데 비해 strip()은 유니코드기반까지 포함한다. 

공백에는 \t, \n " " 등이 있는데 유니코드에는 \u2002, \u00A0, \u3000 등고 공백이고 trim으로는 이런 공백은 제거할 수 없다.

공백 기준으로 문자열을 나눌 때도 주의할 사항이 있는데, split()메서드에서 split(" ");를 사용하면 " "공백 하나를 기준으로 문자열을 나누기 때문에 정규표현식을 사용하면 좋다. 

공백을 나타내는 정규표현식은 \s이다. 쌍따옴표 안에서 사용하려면 \\s로 사용할 수 있고 연속된 공백은 \\s+로 나타낼 수 있다.

Comments