אינטרפולציה של מחרוזת

בתכנות מחשב, אינטרפולציה של מחרוזת (באנגלית: String interpolation) היא תהליך של פענוח מחרוזת מילולית המכילה שומרי מקום, המספקת תוצאה שבה שומרי המקום מוחלפים בערכים המתאימים להם. זוהי צורה של עיבוד תבנית פשוט[1] או, במונחים פורמליים, צורה של קוואזי ציטוט (או החלפה לוגית). שומר המקום עשוי להיות שם משתנה, או בשפות מסוימות ביטוי שרירותי, שמפוענח בהקשר הנוכחי.

אינטרפולציה של מחרוזת היא אלטרנטיבה לבניית מחרוזת באמצעות שרשור, הדורשת פתיחת וסגירת מירכאות שוב ושוב[2] או החלפה למחרוזת בפורמט printf, כאשר המשתנה רחוק מהמקום שבו נעשה בו שימוש. הדגמה של שלוש החלופות:

apples = 4print("I have ${apples} apples.") # string interpolationprint("I have " + apples + " apples.") # string concatenationprint("I have %s apples.", apples) # format string

בדרך כלל מוצעים שני סוגים של ביטוי מילולי: אחד עם אינטרפולציה מופעלת, השני בלי. כאשר אין הפעלה של אינטרפולציה, עדיין יכולה להתבצע פעולת פענוח של מחרוזות מיוחדות, לדוגמה רצף כגון " עשוי להתפענח בהקשרים מסוימים כמרכאות (למשל ב-HTML), אפילו כאשר אין תמיכה באינטרפולציה. מחרוזות ללא אינטרפולציה שגם נמלטות מפענוח רצפים נקראות מחרוזות גולמיות. לדוגמה, בממשק שורת פקודה של יוניקס, מחרוזות במירכאות בודדות הן גולמיות, ואילו מחרוזות במירכאות כפולות מפעילות אינטרפולציה. מצייני מיקום מיוצגים בדרך כלל על ידי סימן ייעודי (בדרך כלל $ או %), למשל $apples או %apples, או עם סוגריים מסולסלים, למשל {apples}, ולפעמים שניהם, למשל ${apples}. במקרים מסוימים ניתן להשתמש במפרטי עיצוב נוספים (כמו ב-printf), למשל {apples:3}, ובמקרים מסוימים ניתן לבצע אינטרפולציה של מפרטי העיצוב עצמם, למשל {apples:width} . הרחבת המחרוזת מתרחשת בדרך כלל בזמן ריצה.

תמיכת השפה באינטרפולציה של מחרוזת משתנה מאוד בין שפות. שפות מסוימות אינן מציעות אינטרפולציה למחרוזות, ומשתמשות במקום זאת בשרשור, פונקציות עיצוב פשוטות או ספריות של תבניות. אינטרפולציה של מחרוזת נפוצה בשפות תכנות רבות העושות שימוש רב בייצוגי מחרוזת של נתונים, כגון Apache Groovy, ג'וליה, Kotlin, Perl, PHP, פייתון, Ruby, סקאלה, סוויפט, Tcl ורוב ממשקי שורת הפקודה של יוניקס.

אלגוריתמים

עריכה

ישנם שני סוגים עיקריים של אלגוריתמי הרחבת משתנים לאינטרפולציה של משתנים:[3]

  1. "החלף והרחב שומרי מקום": יצירת מחרוזת חדשה על בסיס המחרוזת המקורית, על ידי פעולות מצא-החלף. מצא הפניה למשתנה (שומר מקום), החלף אותו בערך המשתנה שלו. אלגוריתם זה אינו מציע אסטרטגיית מטמון.
  2. "פצל וצרף מחרוזת": פיצול המחרוזת למערך, ומיזוגו עם מערך הערכים המתאים; לאחר מכן צירוף כל הפריטים על ידי שרשור. ניתן לשמור את המחרוזת המפוצלת במטמון לשימוש חוזר, למשל כאשר הערכים משתנים.

סוגיות אבטחה

עריכה

אינטרפולציה של מחרוזות, כמו שרשור מחרוזות, עשויה להוביל לבעיות אבטחה. אם נתוני קלט של המשתמש יעברו מילוט או סינון שגוי, המערכת תיחשף להזרקת SQL, הזרקת סקריפט, הזרקת ישות חיצונית של XML (XXE) והתקפות סקריפטים בין-אתרים (XSS).[4]

דוגמה להזרקת SQL:

query = " SELECT x, y, z FROM Table WHERE id='$id' "

אם $id מוחלף ב " '; DELETE FROM Table; SELECT * FROM Table WHERE id=' ", ביצוע שאילתה זו ימחק את כל הנתונים בטבלה.

דוגמאות

עריכה
DATA(apples) = 4.WRITE |I have { apples } apples|.

הפלט יהיה:

I have 4 apples
apples=4echo "I have $apples apples"# orecho "I have ${apples} apples"

הפלט יהיה:

I have 4 apples
apples = 4print("I have $(apples) apples")# orprint("I have {0} apples" % apples)

הפלט יהיה:

I have 4 apples

החל מגרסה 6 קיימת תמיכה באינטרפולציה של מחרוזת.[5]

var apples = 4;var bananas = 3;Console.WriteLine($"I have {apples} apples");Console.WriteLine($"I have {apples + bananas} fruits");

הפלט יהיה:

I have 4 applesI have 7 fruits

שפת סימון ColdFusion

עריכה

תחביר הסקריפט של ColdFusion Markup Language (CFML):

apples = 4;writeOutput("I have #apples# apples");

תחביר תגיות:

<cfset apples = 4><cfoutput>I have #apples# apples</cfoutput>

הפלט יהיה:

I have 4 apples
apples = 4console.log "I have #{apples} apples"

הפלט יהיה:

I have 4 apples
int apples = 4, bananas = 3;print('I have $apples apples.');print('I have ${apples+bananas} fruit.');

הפלט יהיה:

I have 4 apples.I have 7 fruit.

נכון לשנת 2022, בשפת Go אין תמיכה באינטרפולציה של מחרוזות. היו כמה הצעות להוספת תמיכה בגרסה הבאה של השפה, Go 2. במקום אינטרפולציה, גו משתמשת בפורמט printf בפונקציה fmt.Sprintf, בשרשור מחרוזות או בספריות לבניית תבניות כמו text/template.

בשפת גרובי, מחרוזות עם אינטרפולציה ידועות כ-GSStrings:[6]

def quality = "superhero"final age = 52def sentence = "A developer is a $quality, if he is ${age <= 42 ? "young" : "seasoned"}"println sentence

הפלט יהיה:

A developer is a superhero if he is seasoned
var apples = 4;var bananas = 3;trace('I have $apples apples.');trace('I have ${apples+bananas} fruit.');

הפלט יהיה:

I have 4 apples.I have 7 fruit.

נכון ל-2022, שפת התכנות ג'אווה אינה תומכת באינטרפולציה של מחרוזות, במקום זאת היא משתמשת בפונקציות ליצירת פורמט, הידועות שבהן הן המחלקה MessageFormat (החל מגרסת Java 1.1) והפונקציה הסטטית String.format (החל מגרסה 5 של השפה).

JavaScript, החל מתקן ECMAScript 2015 (ES6), תומכת באינטרפולציה של מחרוזות תוך שימוש בסימן הטעמה משני (`). תכונה זו נקראת תבניות מילוליות.[7] להלן דוגמה:

const apples = 4;const bananas = 3;console.log(`I have ${apples} apples`);console.log(`I have ${apples + bananas} fruit`);

הפלט יהיה:

I have 4 applesI have 7 fruit

ניתן להשתמש בתבנית מילולית גם עבור מחרוזת מרובת שורות:

console.log(`This is the first line of text.This is the second line of text.`);

הפלט יהיה:

This is the first line of text.This is the second line of text.
apples = 4bananas = 3print("I have $apples apples and $bananas bananas, making $(apples + bananas) pieces of fruit in total.")

הפלט יהיה:

I have 4 apples and 3 bananas, making 7 pieces of fruit in total.
val quality = "superhero"val apples = 4val bananas = 3val sentence = "A developer is a $quality. I have ${apples + bananas} fruit"println(sentence)

הפלט יהיה:

A developer is a superhero. I have 7 fruit
def apples = 4;def bananas = 3;Console.WriteLine($"I have $apples apples.");Console.WriteLine($"I have $(apples + bananas) fruit.");

השפה תומכת גם בתכונות פורמט מתקדמות, כגון:

def fruit = ["apple", "banana"];Console.WriteLine($<#I have ..$(fruit; "\n"; f => f + "s")#>);

הפלט יהיה:

applesbananas

נים מספקת אינטרפולציה של מחרוזות באמצעות מודול ה-strutils. מחרוזות מילוליות עם פורמט, בהשראת F-string של שפת התכנות פייתון, מסופקות באמצעות מודול strformat, המאקרו strformat מוודא שמחרוזת הפורמט מעוצבת היטב ובעלת טיפוסים נכונים, ולאחר מכן מורחבת לקוד מקור של Nim בזמן ההידור.

import strutils, strformatvar apples = 4var bananas = 3echo "I have $1 apples".format(apples)echo fmt"I have {apples} apples"echo fmt"I have {apples + bananas} fruits"# Multi-lineecho fmt"""I have{apples} apples"""# Debug the formattingecho fmt"I have {apples=} apples"# Custom openChar and closeChar charactersecho fmt("I have (apples) {apples}", '(', ')')# Backslash inside the formatted string literalecho fmt"""{ "yep\nope" }"""

הפלט יהיה:

I have 4 applesI have 4 applesI have 7 fruitsI have4 applesI have apples=4 applesI have 4 {apples}yepope
let numberOfApples = "4";in "I have ${numberOfApples} apples"

הפלט יהיה:

I have 4 apples
const Apples := 4const Bananas := 3Println ("I have `(Apples) apples.\n")Println ("I have `(Apples+Bananas) fruit.\n")

הפלט יהיה:

I have 4 apples.I have 7 fruit.
my $apples = 4;my $bananas = 3;print "I have $apples apples.\n";print "I have @{[$apples+$bananas]} fruit.\n"; # Uses the Perl array (@) interpolation.

הפלט יהיה:

I have 4 apples.I have 7 fruit.
<?php$apples = 5;$bananas = 3;echo "There are $apples apples and $bananas bananas.";echo "\n";echo "I have {$apples} apples and {$bananas} bananas.";

הפלט יהיה:

There are 5 apples and 3 bananas.I have 5 apples and 3 bananas.

כאשר עושים שימוש במירכאות בודדות, לא מבוצעת אינטרפולציה.

Python תומכת באינטרפולציה של מחרוזות החל מגרסה 3.6, תחת השם "formatted string literals".[8][9][10] מחרוזת שכזו מתחילה ב-f או F לפני פתיחת המירכאות, ומשתמשת בסוגריים מסולסלים עבור שומרי המקום:

apples = 4bananas = 3print(f'I have {apples} apples and {bananas} bananas')

הפלט יהיה:

I have 4 apples and 3 bananas
apples = 4puts "I have #{apples} apples"# orputs "I have %s apples" % apples# orputs "I have %{a} apples" % {a: apples}

הפלט יהיה:

I have 4 apples

לראסט אין אינטרפולציה של מחרוזות באופן כללי, אך השפה מספקת פונקציונליות דומה באמצעות פקודת מאקרו, המכונה "מזהים לכודים במחרוזות פורמט", שהוצגה בגרסה 1.58.0, שפורסמה בינואר 2022.[11]

ראסט מספקת עיצוב באמצעות מודול std::fmt, אשר מתממשקים אליו באמצעות פקודות מאקרו שונות כגון format!, write!, ו-print!. פקודות מאקרו אלו מומרות לקוד מקור ראסט בזמן ההידור, שם כל ארגומנט מקיים אינטראקציה עם הפורמטר. הפורמטר תומך בפרמטרים מיקומיים, פרמטרים בעלי שם, טיפוסים של ארגומנטים, הגדרת תכונות עיצוב שונות ולכידת מזהים מהסביבה.

let (apples, bananas) = (4, 3);// println! captures the identifiers when formatting: the string itself isn't interpolated by Rust.println!("There are {apples} apples and {bananas} bananas.");

הפלט יהיה:

There are 4 apples and 3 bananas.

Scala החל מגרסה 2.10 הטמיעה את האינטרפולטורים הבאים של מחרוזות: s, f ו-raw. אפשר גם לכתוב אינטרפולטורים מותאמים אישית או לדרוס את הסטנדרטיים.

האינטרפולטור f הוא מאקרו מהדר המשכתב מחדש מחרוזת פורמט עם ביטויים מוטבעים כקריאה ל-String.format. הוא מוודא שמחרוזת הפורמט מעוצבת היטב ובעלת טיפוסיות נכונה.

האינטרפולטורים הסטנדרטיים

עריכה

אינטרפולציית מחרוזת של Scala 2.10+ מאפשרת הטמעת הפניות משתנות ישירות במחרוזות מעובדות. להלן דוגמה:

val apples = 4val bananas = 3//before Scala 2.10printf("I have %d apples\n", apples)println("I have %d apples" format apples)//Scala 2.10+println(s"I have $apples apples")println(s"I have ${apples + bananas} fruits")println(f"I have $apples%d apples")

הפלט יהיה:

I have 4 apples

Sciter (tiscript)

עריכה

בשפת Sciter כל פונקציה עם שם שמתחיל ב-$ נחשבת כפונקציה עם אינטרפולציה ולכן האינטרפולציה ניתנת להתאמה אישית ורגישה להקשר:

var apples = 4var bananas = 3var domElement = ...;domElement.$content(<p>I have {apples} apples</p>);domElement.$append(<p>I have {apples + bananas} fruits</p>);

כאשר:

domElement.$content(<p>I have {apples} apples</p>);

הופך לזה:

domElement.html = "<p>I have " + apples.toHtmlString() + " apples</p>";
 apples = 4 ; bananas = 3 Output = "I have " apples " apples." Output = "I have " (apples + bananas) " fruit."

הפלט יהיה:

I have 4 apples.I have 7 fruit.

בסוויפט, ניתן ליצור ערך מחרוזת חדש משילוב של קבועים, משתנים, מחרוזות וביטויים על ידי הכללת הערכים שלהם בתוך מחרוזת.[12] כל פריט המוכנס למחרוזת עטוף בזוג סוגריים, עם קו נטוי אחורי.

let apples = 4print("I have \(apples) apples")

הפלט יהיה:

I have 4 apples

שפת הפקודה של הכלי תמיד תמכה באינטרפולציה של מחרוזות בכל המחרוזות המופרדות במירכאות.

set apples 4puts "I have $apples apples."

הפלט יהיה:

I have 4 apples.

אם רוצים לשנות את הפורמט של הערכים ולא רק להחליף אותם, קיימת פונקציית פירמוט.

set apples 4puts [format "I have %d apples." $apples]

נכון לגרסה 1.4, TypeScript תומכת באינטרפולציה של מחרוזות באמצעות סימן הטעמה משני (`). לדוגמה:

var apples: number = 4;console.log(`I have ${apples} apples`);

הפלט יהיה:

I have 4 apples

The console.log function can be used as a printf function. The above example can be rewritten, thusly:

var apples: number = 4;console.log("I have %d apples", apples);

הפלט נשאר אותו דבר.

נכון ל-Visual Basic 14, אינטרפולציה של מחרוזות נתמכת בשפה.[13]

name = "Tom"Console.WriteLine($"Hello, {name}")

ידפיס:

"Hello, Tom".

ראו גם

עריכה

הערות שוליים

עריכה
  1. ^ "Enforcing Strict Model-View Separation in Template Engines", T. Parr (2004), WWW2004 conference.
  2. ^ "Interpolation in Perl". This is much tidier than repeated uses of the '.' concatenation operator.
  3. ^ "smallest-template-system/Simplest algorithms", an online tutorial for placeholder-template-systems.
  4. ^ google-caja.googlecode.com https://web.archive.org/web/20121019065315/http://google-caja.googlecode.com/svn/changes/mikesamuel/string-interpolation-29-Jan-2008/trunk/src/js/com/google/caja/interp/index.html#-autogen-id-1. אורכב מ-המקור ב-2012-10-19. {{cite web}}: חסר או ריק |title= (עזרה)
  5. ^ C# String Interpolation, באתר w3schools
  6. ^ "The Apache Groovy programming language - Syntax". groovy-lang.org. נבדק ב-2021-06-20.
  7. ^ "Template literals (Template strings) - JavaScript | MDN".
  8. ^ "The Python Tutorial: 7.1.1. Formatted String Literals".
  9. ^ "The Python Language Reference: 2.4.3. Formatted string literals".
  10. ^ "PEP 498 -- Literal String Interpolation".
  11. ^ "Announcing Rust 1.58.0: Captured identifiers in format strings". 2022-01-13.
  12. ^ "Strings and Characters — The Swift Programming Language (Swift 5.5)". docs.swift.org. נבדק ב-2021-06-20.
  13. ^ KathleenDollard. "Interpolated Strings - Visual Basic". docs.microsoft.com (באנגלית אמריקאית). נבדק ב-2021-06-20.