Ergebnnisse der Suche beeinflussen

  • Moin Leute,


    ich habe eine Domino-Datenbank, die über Web den Content zur Verfügung stellt. Hier habe ich auch eine personalisierte Suchmaske erstellt. Was mich nun aber langsam zum Verzweifeln bringt, ist die Reihenfolge der Suchergebnisse. (?SearchView)


    Wenn ich z.B. nach "Polen" suche, will ich auch die Seite "Allgemeine Informationen zu Polen" haben und nicht irgendwelche Seiten, auf denen irgendwo "Polen" steht.


    Habe ich eine Möglichkeit irgendwie Einfluss auf die Relevanz zu nehmen?
    Was sind die Kriterien, nach denen die Relevanz berechnet wird?
    Gibt es evtl. andere Lösungen?


    Vielen Dank für Eure Hilfe!


    patri

    Ärgerlich wenn am Ende des Geldes noch soviel Monat übrig ist...

  • bin mir jetzt nicht 100% sicher ob das auch im web geht (geht bestimmt!) aber im notes client kann man auch nur den inhalt eines feldes (in deinem fall dann das thema) durchsuchen.


    hier sollte man mal ansetzen.


    ansonsten glaube ich nicht das man die relevanz beeinflussen kann.

    bunt ist das dasein und granatenstark. volle kanne hoshi's!


    IBM Certified Advanced System Administrator (R5, D6, D7)
    IBM Certified Advanced Application Developer (R5, D6, D7, D8)

  • Die Hilfe sagt zu den diversen FTSearchScore-Properties:

    Zitat


    The score is determined by the number of target words that are found in the entry, the term weights assigned to the target words, and any proximity operators in the search query.


    Das wird also intern berechnet und ist darüber hinaus Read-Only.

    Life is not a journey to the grave with the intention of arriving safely in a pretty and well-preserved body, but rather to skid in broadside, thoroughly used up, totally worn out, and loudly proclaiming "Wow, what a ride!!! :evil:
    Beschleunigung ist, wenn die Tränen der Ergriffenheit waagrecht zum Ohr hin abfliessen - Walter Röhrl

  • hat eigentlich mal jemand getestet ob eine höhere gewichtung erzielt wird, wenn man z. b. die felder Subject und Body nennt anstatt Thema und Inhalt?


    es gibt ja so ein paar feldnamen die innerhalb von notes schon eine gewisse rolle spielen.

    bunt ist das dasein und granatenstark. volle kanne hoshi's!


    IBM Certified Advanced System Administrator (R5, D6, D7)
    IBM Certified Advanced Application Developer (R5, D6, D7, D8)

  • Also das mit den Feldnamen Adressieren geht schon.. Aber ich kann ja nicht sagen, dass dsas Ergebnis eine höhere Gewichtung hat, wenn das Wort im Titel vorkommt, als wenn es im Inhalt vorkommt. Und genau das ist es, was mich ein wenig wurm :(


    Ich will die Gewichtung ja gar nicht überschreiben. Reciht mir, wenn ich sie manipulieren kann :D

    Ärgerlich wenn am Ende des Geldes noch soviel Monat übrig ist...

  • ein 'kleiner' ditry-trick wäre aus meiner sicht, den inhalt der wichtigeren felder einfach doppelt im dokument abzuspeichern ;)


    also ein berechnetes feld anlegen, sagen wir DummyThema, was den inhalt von thema hat. dann wird dieses dokument bzw. der inhalt von thema denke ich höher bewertet. bestimmt keine tolle lösung aber evtl. eine funktionierende ...

    bunt ist das dasein und granatenstark. volle kanne hoshi's!


    IBM Certified Advanced System Administrator (R5, D6, D7)
    IBM Certified Advanced Application Developer (R5, D6, D7, D8)

  • Danke aweinrei,


    das sidn die Dinge, die ich hören will.. Dirty und wirksam :D


    Ich werd es gleich mal ausprobieren...

    Ärgerlich wenn am Ende des Geldes noch soviel Monat übrig ist...

  • kann natürlich nur bedingt funktionieren. wenn jemand in ein richtextfeld 5x Polen reinschreibt wird dieses dokument mit sicherheit immer noch oben stehen.


    vielleicht kannst du ja bei deinen tests auch die geschichte mit den feldnamen mal prüfen und ein ergebniss hier posten.

    bunt ist das dasein und granatenstark. volle kanne hoshi's!


    IBM Certified Advanced System Administrator (R5, D6, D7)
    IBM Certified Advanced Application Developer (R5, D6, D7, D8)

  • So verständlich das Anliegen auch sein mag: du wirst immer das Problem haben, dass deine Vorstellung unter Umständen nicht immer mit dem korrellieren, was IBM in seinen FTSearchScore-Code reinprogrammiert hat. Alles, was bereits an möglichen Optimierungen genannt wurde, hat im Endeffekt die selben Gebrechlichkeiten, wie bspw. das Google-Ranking: zum einen ist es undurchsichtlich weil nicht offen gelegt, zum anderen ziemlich einfach ziemlich manipulierbar.


    Im Endeffekt hilft nur eines: sich selbst einen Ranking-Mechanismus schreiben und das Resultat in ein verstecktes Feld im Dokument schreiben, das dann beim Suchen ausgewertet wird. Hier wäre u.a. der Bayes-Code eine Überlegung wert. Der wird zwar vorrangig auf Spam angewandt, aber wo steht geschrieben, dass das das einzig mögliche Einsatzgebiet ist? Tatsächlich beruht es eh nur auf Wortlisten (und Abwandlungen der Worte), sowie deren Gewichtung. Also nur die Stoppworte anders definiert, deren Einstufung als Gut oder Schlecht umgedreht, fertig ist der Lack.


    Ok, zugegeben: das ist ein umfangreiches Ding und sicher nicht für jeden und jede Umgebung praktikabel. Aber nur so kann man volle Kontrolle über die Ergebnisse haben. Meine Meinung...

    Life is not a journey to the grave with the intention of arriving safely in a pretty and well-preserved body, but rather to skid in broadside, thoroughly used up, totally worn out, and loudly proclaiming "Wow, what a ride!!! :evil:
    Beschleunigung ist, wenn die Tränen der Ergriffenheit waagrecht zum Ohr hin abfliessen - Walter Röhrl