简短版本:如何将具有最小冲突的任意字符串转换为6位数字?
长版:
我正在与一个小型图书馆合作,该图书馆有一堆没有ISBN的书籍。这些通常是较旧的,绝大部分发行商发行的绝版出版物,从未开始使用ISBN,我想为他们生成伪造的ISBN,以帮助条形码扫描和借阅。
从技术上讲,真正的ISBN由商业实体控制,但是可以使用这种格式来分配不属于真正的发布者的编号(因此不应引起任何冲突)。
格式如下:
978-0-01-######-?
给您6位数字,从000000到999999,并带有?最后是校验和。
在这种方案中,是否可以将任意书名转换为6位数字,并且发生冲突的可能性很小?
最佳答案
在为making a fixed-length hash使用代码段并计算了ISBN-13 checksum之后,我设法创建了看起来很丑陋的C#代码。它将使用任意字符串并将其转换为有效(但为假)的ISBN-13:
public int GetStableHash(string s)
{
uint hash = 0;
// if you care this can be done much faster with unsafe
// using fixed char* reinterpreted as a byte*
foreach (byte b in System.Text.Encoding.Unicode.GetBytes(s))
{
hash += b;
hash += (hash << 10);
hash ^= (hash >> 6);
}
// final avalanche
hash += (hash << 3);
hash ^= (hash >> 11);
hash += (hash << 15);
// helpfully we only want positive integer < MUST_BE_LESS_THAN
// so simple truncate cast is ok if not perfect
return (int)(hash % MUST_BE_LESS_THAN);
}
public int CalculateChecksumDigit(ulong n)
{
string sTemp = n.ToString();
int iSum = 0;
int iDigit = 0;
// Calculate the checksum digit here.
for (int i = sTemp.Length; i >= 1; i--)
{
iDigit = Convert.ToInt32(sTemp.Substring(i - 1, 1));
// This appears to be backwards but the
// EAN-13 checksum must be calculated
// this way to be compatible with UPC-A.
if (i % 2 == 0)
{ // odd
iSum += iDigit * 3;
}
else
{ // even
iSum += iDigit * 1;
}
}
return (10 - (iSum % 10)) % 10;
}
private void generateISBN()
{
string titlehash = GetStableHash(BookTitle.Text).ToString("D6");
string fakeisbn = "978001" + titlehash;
string check = CalculateChecksumDigit(Convert.ToUInt64(fakeisbn)).ToString();
SixDigitID.Text = fakeisbn + check;
}
关于string - 根据书名生成伪造的ISBN? (或: How to hash a string into a 6-digit numeric ID),我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/12834771/