Hoi hoi,
Ik ben momenteel een applicatie in C# en asp.net met Visual C# aan het maken die tekst in een word document verbeterd. dit gebeurd aan de hand van een webpagina. En hier ben ik iets heel vreemd tegengekomen.
Ik haal de volgende tekst uit het word bestand: EMPIRICAL VALIDATION –A FAMILY OF EXPERIMENTS En dat moet worden: EMPIRICAL VALIDATION – A FAMILY OF EXPERIMENTS
Dus logischer wijze doe ik een replace van " -" met " - ". Maar dit werkt niet. En zoals je kunt zien zijn "-" en "–" niet dezelfde tekens, ze zijn niet even breed. "–" is gekopieerd van de webpagina en "-" is getypt met mijn toetsenbord. Toen dacht ik dat het misschien een teken was dat ik nog niet kende en dus kopieerde ik "–" van de webpagina en plakte ik het in mijn code. Nu werkte de replace wel.
Wat wel heel vreemd is, is dat het gekopieerde teken "–" dat ik geplakt heb in mijn code er daar (bijna) exact hetzelfde uitziet als "-", maar C# behandelt het duidelijk als een ander teken. Ik zeg bijna omdat er welgeteld 3 pixels verschillend zijn tussen "–" en "-". beiden zijn in de Visual C# editor 8 pixels breed en ze hebben volgende RGB waarden: "–": 255, 221, 149 179, 021, 021 163, 021, 021 163, 021, 021 163, 021, 021 163, 021, 021 163, 021, 021 210, 221, 255
"-": 255, 255, 185 194, 021, 021 163, 021, 021 163, 021, 021 163, 021, 021 163, 021, 021 163, 021, 021 225, 255, 255
Zoals je misschien van deze waarden kan afleiden 'lijkt' het bovenste iets breder omdat de pixels aan de buitenkant iets donkerder zijn. Hier is nog ingezoomde bitmap om het te verduidelijken:
klik
het liggend streepje linksboven is het vreemde streepje, de rest zijn met mijn toetsenbord getypt.
Heeft er iemand dit nog al eens tegengekomen? hoe komt dit?
|