2008년 10월 9일 목요일

펌즈(PUMz)의 동작 원리

펌즈에서 클리핑(Clipping)을 시작하면, 엔진(Engine)은 룰(Rule)에 정의된 태스크(Task)를 차례대로 실행합니다. 태스크에는 여러개의 컨텐트 핸들러(Content Handler)가 있고, 그 중 최상위 컨텐트 핸들러가 먼저 실행됩니다. 컨텐트 핸들러가 실행되면 웹 사이트를 읽어 오기도 하고, 읽어온 웹 사이트에서 연결된 자식 웹 사이트를 찾아내기도 합니다. 이를 선처리라고 하면, 후처리는 컨텐트 필터(Content Filter)를 통해서 읽어온 컨텐트에서 필요한 부분을 추리거나 이미지 파일 등을 다시 읽어오는 역할을 하기도 합니다. 컨텐트 필터 중엔 컨텐트를 파일로 저장하는 역할을 하기도 합니다.

용어가 난해하시면 용어에 대한 포스트를 읽어 보시기 바랍니다.

댓글 없음:

댓글 쓰기