<p>Excellente question ! J’ai essayé en écrivant du code et j’ai généré les tokens en utilisant à la fois Tiktoken et le SDK Azure OpenAI. Malheureusement, les résultats sont différents, donc la réponse est non. Vous ne pouvez pas utiliser Tiktoken pour générer les embeddings.</p>
<p>Voici mon code d’exemple :</p>
<pre><code class="lang-auto">using Azure;
using Azure.AI.OpenAI;
using Tiktoken;
var stringToEncode =
"Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.";
var encoder = Tiktoken.Encoding.TryForModel("text-embedding-ada-002"😉;
var data1 = encoder!.Encode(stringToEncode);//produced a 96 element array.
var openAIClient = new OpenAIClient(new Uri("https://xyz.openai.azure.com/"😉, new AzureKeyCredential("my-azure-openai-key"😉);
var embeddings = openAIClient.GetEmbeddings(new EmbeddingsOptions()
{
DeploymentName = "text-embedding-ada-002",
Input = { stringToEncode }
});
var data2 = embeddings.Value.Data[0].Embedding;//produced a 1536 element array.
Console.WriteLine($"Data 1 length: {data1.Count}; Data 2 length: {data2.Length}"😉;
</code></pre>