onze sponsors
Hallo,Zoals iedereen natuurlijk weet wordt er in data warehouse modellen regelmatig gebruik gemaakt van zogenaamde delta structuren om het load proces te verlichten.Een veel gebruikte methoden is gewoon twee tabellen en hun velden tegen elkaar te vergelijken. Bij echter brede tabellen (veel kolommen) die vergeleken moet worden kan dit een redelijk vertragende factor gaan worden. Ik zie nu dat er dan gebruik gemaakt wordt van CHECKSUM() of BINARY_CHECKSUM(), alleen lees ik ook op het web dat hier wel eens problemen mee kunnen onstaan dat verschillende gegevens dezelfde checksum opleveren, zie onderstaand voorbeeld:SELECT BINARY_CHECKSUM('aa','AA','Arjan')----------- 4225134
SELECT BINARY_CHECKSUM('BQ','AA','Arjan')----------- 4225134Bovenstaande is gedaan op een SQL2000 server, ik heb even geen SQL2005 bij de hand, geldt hier het zelfde?De kans hierop verminderd natuurlijk met het aantal velden dat je in je checksum opneemt, maar de kans blijft dus bestaan.Wat zou je hier aan doen?Iemand als eens bezig geweest met de checksum task: http://www.sqlis.com/post/Checksum-Transformation.aspx ? Zou die wel uniek zijn in alle gevallen?Gr,Arjan