Utilizando o arquivo .STW do CDS/ISIS
Elysio Mira Soares de Oliveira
infoarte@elysio.com.br

O Arquivo STW (StopWords) é um arquivo que complementa a definição de uma base de dados CDS/ISIS. Seu objetivo é fornecer ao sistema, informações sobre termos que nunca deverão constituir chaves de entrada em um índice de busca e portanto deverão ser ignorados durante processos de extração de chaves para composição do arquivo invertido (índice).

Considerando que é um arquivo de palavras, ele somente será executando quando na FST (tabela de seleção de campos) existir alguma instrução que utilize a técnica 4 (palavra por palavra). Caso contrário, não surtirá nenhum efeito. O arquivo de StopWords deve ser criado com um editor de texto qualquer e gravado no formato MS-DOS com o nome da base de dados e com a extensão .STW. Deverá estar localizado no mesmo diretório onde estão instalados os arquivos relativos à base de dados.

Por exemplo, se o nome da nossa base de dados for CURSO, e estiver instalada no diretório “c:\winisis\data, o arquivo de StopWords deverá ser gravado com o nome CURSO.STW no diretório “c:\winisis\data”.

Estrutura do arquivo

As “StopWords” deverão ser registradas, uma em cada linha, em maiúsculas, sem acentuação gráfica e ordenadas alfabeticamente. Veja abaixo o exemplo do conteúdo de um arquivo STW:

A
AN
AND
AO
AOS
AS
BY
DA
DAS
DE
DEL
DO
DOS
E
EL
EM
EN
ES
IN
IS
ITS
LA
LAS
LES
LO
LOS
MAS
NA
NAS
NI
NO
NOS
O
OF
ON
OS
OU
SE
SU
SUA
SUS
THE
TO
UM
UMA
UN
UNA
UNAS
UNOS
UNS
Y

Nota: Toda alteração efetuado no arquivo STW irá requerer a reconstrução do índice (arquivo invertido) da base de dados.