CavalliumDBEngine/src/main/java/it/cavallium/dbengine/lucene/analyzer/N4CharGramEdgeAnalyzer.java

package it.cavallium.dbengine.lucene.analyzer;

import it.cavallium.dbengine.lucene.LuceneUtils;
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.Tokenizer;
import org.apache.lucene.analysis.core.KeywordTokenizer;
import org.apache.lucene.analysis.ngram.EdgeNGramTokenFilter;
import org.apache.lucene.analysis.standard.StandardTokenizer;

public class N4CharGramEdgeAnalyzer extends Analyzer {

	private final boolean words;

	public N4CharGramEdgeAnalyzer(boolean words) {
		this.words = words;
	}

	@Override
	protected TokenStreamComponents createComponents(final String fieldName) {
		Tokenizer tokenizer;
		TokenStream tokenStream;
		if (words) {
			tokenizer = new StandardTokenizer();
			tokenStream = tokenizer;
		} else {
			tokenizer = new KeywordTokenizer();
			tokenStream = tokenizer;
		}
		tokenStream = LuceneUtils.newCommonFilter(tokenStream, words);
		tokenStream = new EdgeNGramTokenFilter(tokenStream, 3, 5, false);

		return new TokenStreamComponents(tokenizer, tokenStream);
	}

	@Override
	protected TokenStream normalize(String fieldName, TokenStream in) {
		TokenStream tokenStream = in;
		tokenStream = LuceneUtils.newCommonNormalizer(tokenStream);
		return tokenStream;
	}
}
Global scores between multiple lucene shards 2021-02-04 22:42:57 +01:00			`package it.cavallium.dbengine.lucene.analyzer;`
Port code from private repository 2020-12-07 22:15:18 +01:00
Global scores between multiple lucene shards 2021-02-04 22:42:57 +01:00			`import it.cavallium.dbengine.lucene.LuceneUtils;`
Port code from private repository 2020-12-07 22:15:18 +01:00			`import org.apache.lucene.analysis.Analyzer;`
			`import org.apache.lucene.analysis.TokenStream;`
			`import org.apache.lucene.analysis.Tokenizer;`
			`import org.apache.lucene.analysis.core.KeywordTokenizer;`
			`import org.apache.lucene.analysis.ngram.EdgeNGramTokenFilter;`
Global scores between multiple lucene shards 2021-02-04 22:42:57 +01:00			`import org.apache.lucene.analysis.standard.StandardTokenizer;`
Port code from private repository 2020-12-07 22:15:18 +01:00
			`public class N4CharGramEdgeAnalyzer extends Analyzer {`

Global scores between multiple lucene shards 2021-02-04 22:42:57 +01:00			`private final boolean words;`
Port code from private repository 2020-12-07 22:15:18 +01:00
Global scores between multiple lucene shards 2021-02-04 22:42:57 +01:00			`public N4CharGramEdgeAnalyzer(boolean words) {`
			`this.words = words;`
Port code from private repository 2020-12-07 22:15:18 +01:00			`}`

			`@Override`
			`protected TokenStreamComponents createComponents(final String fieldName) {`
Global scores between multiple lucene shards 2021-02-04 22:42:57 +01:00			`Tokenizer tokenizer;`
			`TokenStream tokenStream;`
			`if (words) {`
			`tokenizer = new StandardTokenizer();`
			`tokenStream = tokenizer;`
			`} else {`
			`tokenizer = new KeywordTokenizer();`
			`tokenStream = tokenizer;`
			`}`
			`tokenStream = LuceneUtils.newCommonFilter(tokenStream, words);`
			`tokenStream = new EdgeNGramTokenFilter(tokenStream, 3, 5, false);`
Port code from private repository 2020-12-07 22:15:18 +01:00
			`return new TokenStreamComponents(tokenizer, tokenStream);`
			`}`

			`@Override`
			`protected TokenStream normalize(String fieldName, TokenStream in) {`
			`TokenStream tokenStream = in;`
			`tokenStream = LuceneUtils.newCommonNormalizer(tokenStream);`
			`return tokenStream;`
			`}`
			`}`